Блокнот: как добавить к каждой строке префикс последней строки, содержащей строку?

Блокнот: как добавить к каждой строке префикс последней строки, содержащей строку?

Я работаю с журналами чатов и хочу их отформатировать.

Они выглядят именно так, включая символы #:

Tuesday, February 24, 2015
##Person1 (21:22:01): hello
##Person2 (21:22:37): hi
Wednesday, February 25, 2015
##Person1 (13:12:43): hey
##Person2 (13:13:04): hey

Дата публикуется только для каждого нового дня, и я бы хотел, чтобы она была отформатирована примерно так, чтобы ее можно было использовать в электронной таблице:

Tuesday, February 24, 2015
Tuesday, February 24, 2015##Person1 (21:22:01): hey
Tuesday, February 24, 2015##Person2 (21:22:37): hi
Wednesday, February 25, 2015
Wednesday, February 25, 2015##Person1 (13:12:43): hey
Wednesday, February 25, 2015##Person2 (13:13:04): hey

После этого я могу легко удалить строки, не содержащие строку ##, чтобы избавиться от строк, содержащих только дату.

Есть ли способ заставить Notepad++ добавлять всю последнюю строку, содержащую строку из даты (например, \d{1,2}, 201\d{1}$), в начало каждой строки под ней (до следующего экземпляра)?

решение1

Боюсь, это невозможно сделать в Notepad++.

Вот однострочный код на Perl, который выполняет эту работу.

perl -ane '$date = $1 if /^(\w+,\h+\w+\h+\d\d?,\h+20\d\d)/;s/^(?=##)/$date/ && print;' file.txt

Если вы хотите заменить файл на месте, используйте:

perl -i -ane '$date = $1 if /^(\w+,\h+\w+\h+\d\d?,\h+20\d\d)/;s/^(?=##)/$date/ && print;' file.txt

Выход:

Tuesday, February 24, 2015##Person1 (21:22:01): hello
Tuesday, February 24, 2015##Person2 (21:22:37): hi
Wednesday, February 25, 2015##Person1 (13:12:43): hey
Wednesday, February 25, 2015##Person2 (13:13:04): hey

Объяснение регулярного выражения:

/               # delimiter
  ^             # beginning of line
  (             # start group 1
    \w+         # 1 or more word character
    ,           # a comma
    \h+         # 1 or more horizontal spaces
    \w+         # 1 or more word character
    \h+         # 1 or more horizontal spaces
    \d\d?       # 1 or 2 digits
    ,           # a comma
    \h+         # 1 or more horizontal spaces
    20\d\d      # 20 and 2 digits
  )             # end group 1
/               # delimiter


s/              # substitute, delimiter
  ^             # beginning of line
  (?=##)        # positive lookahead, zero-length assertion that make sure we have ## at the beginning
/               # delimiter
  $date         # the date found with the preceding  regex
/               # delimiter

Связанный контент