Substitua a string que contém a nova linha em um arquivo enorme

Question 1

Isso é realmente trivial em Perl, você não deveria odiar isso!

perl -i.bak -pe 's/>\n/>/' file

Explicação

-i: edite o arquivo no local e crie um backup do original chamado file.bak. Se você não quiser um backup, basta usar perl -i -pe.
-pe: leia o arquivo de entrada linha por linha e imprima cada linha após aplicar o script fornecido como -e.
s/>\n/>/: a substituição, assim como sed.

E aqui está uma awkabordagem:

awk  '{if(/>$/){printf "%s",$0}else{print}}' file2

Answer

Isso é realmente trivial em Perl, você não deveria odiar isso!

perl -i.bak -pe 's/>\n/>/' file

Explicação

-i: edite o arquivo no local e crie um backup do original chamado file.bak. Se você não quiser um backup, basta usar perl -i -pe.
-pe: leia o arquivo de entrada linha por linha e imprima cada linha após aplicar o script fornecido como -e.
s/>\n/>/: a substituição, assim como sed.

E aqui está uma awkabordagem:

awk  '{if(/>$/){printf "%s",$0}else{print}}' file2

Question 2

Uma perlsolução:

$ perl -pe 's/(?<=>)\n//'

Explicação

s///é usado para substituição de string.
(?<=>)é o padrão lookbehind.
\ncorresponde à nova linha.

Todo o padrão significa remover todas as novas linhas anteriores >.

Answer

Uma perlsolução:

$ perl -pe 's/(?<=>)\n//'

Explicação

s///é usado para substituição de string.
(?<=>)é o padrão lookbehind.
\ncorresponde à nova linha.

Todo o padrão significa remover todas as novas linhas anteriores >.

Question 3

Que tal agora:

sed ':loop
  />$/ { N
    s/\n//
    b loop
  }' file

Para GNU sed, você também pode tentar adicionar a opção -u( --unbuffered) conforme a pergunta. GNU sed também está satisfeito com isso como uma simples linha:

sed ':loop />$/ { N; s/\n//; b loop }' file

Answer

Que tal agora:

sed ':loop
  />$/ { N
    s/\n//
    b loop
  }' file

Para GNU sed, você também pode tentar adicionar a opção -u( --unbuffered) conforme a pergunta. GNU sed também está satisfeito com isso como uma simples linha:

sed ':loop />$/ { N; s/\n//; b loop }' file

Question 4

sednão fornece uma maneira de emitir saída sem uma nova linha final. Sua abordagem using Nfunciona fundamentalmente, mas armazena linhas incompletas na memória e, portanto, pode falhar se as linhas se tornarem muito longas (as implementações sed normalmente não são projetadas para lidar com linhas extremamente longas).

Você pode usar o awk.

awk '{if (/<$/) printf "%s", $0; else print}'

Uma abordagem alternativa é trocar tro caractere de nova linha por um caractere “chato” e de ocorrência frequente. O espaço pode funcionar aqui – escolha um caractere que tende a aparecer em todas as linhas ou pelo menos em uma grande proporção de linhas em seus dados.

tr ' \n' '\n ' | sed 's/> />/g' | tr '\n ' ' \n'

Answer

sednão fornece uma maneira de emitir saída sem uma nova linha final. Sua abordagem using Nfunciona fundamentalmente, mas armazena linhas incompletas na memória e, portanto, pode falhar se as linhas se tornarem muito longas (as implementações sed normalmente não são projetadas para lidar com linhas extremamente longas).

Você pode usar o awk.

awk '{if (/<$/) printf "%s", $0; else print}'

Uma abordagem alternativa é trocar tro caractere de nova linha por um caractere “chato” e de ocorrência frequente. O espaço pode funcionar aqui – escolha um caractere que tende a aparecer em todas as linhas ou pelo menos em uma grande proporção de linhas em seus dados.

tr ' \n' '\n ' | sed 's/> />/g' | tr '\n ' ' \n'

Substitua a string que contém a nova linha em um arquivo enorme

Responder1

Explicação

Responder2

Responder3

Responder4

informação relacionada