Заменить строку, содержащую новую строку в огромном файле

Question 1

В Perl это действительно тривиально, не стоит это ненавидеть!

perl -i.bak -pe 's/>\n/>/' file

Объяснение

-i: отредактируйте файл на месте и создайте резервную копию оригинала под названием file.bak. Если вам не нужна резервная копия, просто используйте perl -i -peвместо этого.
-pe: прочитать входной файл построчно и вывести каждую строку после применения скрипта, указанного как -e.
s/>\n/>/: замена, как и sed.

И вот awkподход:

awk  '{if(/>$/){printf "%s",$0}else{print}}' file2

Answer

В Perl это действительно тривиально, не стоит это ненавидеть!

perl -i.bak -pe 's/>\n/>/' file

Объяснение

-i: отредактируйте файл на месте и создайте резервную копию оригинала под названием file.bak. Если вам не нужна резервная копия, просто используйте perl -i -peвместо этого.
-pe: прочитать входной файл построчно и вывести каждую строку после применения скрипта, указанного как -e.
s/>\n/>/: замена, как и sed.

И вот awkподход:

awk  '{if(/>$/){printf "%s",$0}else{print}}' file2

Question 2

Решение perl:

$ perl -pe 's/(?<=>)\n//'

Объяснение

s///используется для замены строк.
(?<=>)это шаблон ретроспективного просмотра.
\nсоответствует новой строке.

Весь шаблон подразумевает удаление всех символов новой строки, которые были >до него.

Answer

Решение perl:

$ perl -pe 's/(?<=>)\n//'

Объяснение

s///используется для замены строк.
(?<=>)это шаблон ретроспективного просмотра.
\nсоответствует новой строке.

Весь шаблон подразумевает удаление всех символов новой строки, которые были >до него.

Question 3

Как насчет этого:

sed ':loop
  />$/ { N
    s/\n//
    b loop
  }' file

Для GNU sed вы также можете попробовать добавить опцию -u( --unbuffered) согласно вопросу. GNU sed также справляется с этим как с простой однострочной командой:

sed ':loop />$/ { N; s/\n//; b loop }' file

Answer

Как насчет этого:

sed ':loop
  />$/ { N
    s/\n//
    b loop
  }' file

Для GNU sed вы также можете попробовать добавить опцию -u( --unbuffered) согласно вопросу. GNU sed также справляется с этим как с простой однострочной командой:

sed ':loop />$/ { N; s/\n//; b loop }' file

Question 4

sedне предоставляет способа выдавать вывод без завершающего символа новой строки. Ваш подход с использованием Nв основном работает, но сохраняет неполные строки в памяти и, таким образом, может дать сбой, если строки станут слишком длинными (имплементации sed обычно не предназначены для обработки очень длинных строк).

Вместо этого вы можете использовать awk.

awk '{if (/<$/) printf "%s", $0; else print}'

Альтернативный подход заключается в использовании trдля замены символа новой строки на «скучный», часто встречающийся символ. Пробел может сработать здесь — выберите символ, который имеет тенденцию появляться в каждой строке или, по крайней мере, в большой части строк в ваших данных.

tr ' \n' '\n ' | sed 's/> />/g' | tr '\n ' ' \n'

Answer

sedне предоставляет способа выдавать вывод без завершающего символа новой строки. Ваш подход с использованием Nв основном работает, но сохраняет неполные строки в памяти и, таким образом, может дать сбой, если строки станут слишком длинными (имплементации sed обычно не предназначены для обработки очень длинных строк).

Вместо этого вы можете использовать awk.

awk '{if (/<$/) printf "%s", $0; else print}'

Альтернативный подход заключается в использовании trдля замены символа новой строки на «скучный», часто встречающийся символ. Пробел может сработать здесь — выберите символ, который имеет тенденцию появляться в каждой строке или, по крайней мере, в большой части строк в ваших данных.

tr ' \n' '\n ' | sed 's/> />/g' | tr '\n ' ' \n'

Заменить строку, содержащую новую строку в огромном файле

решение1

Объяснение

решение2

решение3

решение4

Связанный контент