Combine o padrãoA e imprima-o somente quando o padrãoB corresponder, incluindo a seguinte linha

Question 1

awk '
   $0 ~ /mod/ { md=$0 }
   $0 ~ /search_string/ { if(md!="") { print md }; md="" ; print; getline; print }
   '

Explicação:

Uma linha contendo modé salva como md.
Uma linha contendo search_stringgatilhos que imprimem o salvo anteriormente md, a própria linha e a próxima linha.
if(md!="")e md=""existem para garantir que você não obtenha modlinhas duplicadas quando houver muitos search_string-s em um único mod( mod start3no seu exemplo).

Observação:

Uma linha contendo ambos mode search_stringquebrará essa lógica.

Answer

awk '
   $0 ~ /mod/ { md=$0 }
   $0 ~ /search_string/ { if(md!="") { print md }; md="" ; print; getline; print }
   '

Explicação:

Uma linha contendo modé salva como md.
Uma linha contendo search_stringgatilhos que imprimem o salvo anteriormente md, a própria linha e a próxima linha.
if(md!="")e md=""existem para garantir que você não obtenha modlinhas duplicadas quando houver muitos search_string-s em um único mod( mod start3no seu exemplo).

Observação:

Uma linha contendo ambos mode search_stringquebrará essa lógica.

Question 2

Seu arquivo contém caracteres de "retorno de carro". É melhor removê-los no Unix. Para imprimir o que a sequência de comandos que você postou imprimiu (com os retornos de carro removidos), tente:

awk '{gsub(/\r/,"")}
     /mod/          { a = $0 }
     /search_string/{ if(a!=""){print(a);a=""}
                      print;getline;print
                    }
    ' infile

Ou como uma linha:

$ awk '{gsub(/\r/,"")}/mod/{a=$0}/search_string/{if(a!=""){print(a);a=""}print;getline;print}' infile

mod start3  
 search_string yada yada  
 hello  
 search_string yada yada  
 bye  
mod start4  
 search_string baba baba  
 this too

Como é possível usar um separador de registros com vários caracteres no (GNU) awk, podemos definir o separador de registros mode imprimir apenas registros que contenham search_string. O printf é necessário para reconstruir o registro original.

Para imprimir o que você postou como "Saída esperada", tente:

awk '/search_string/{printf("mod%s", $0)}' RS=mod infile

Answer

Seu arquivo contém caracteres de "retorno de carro". É melhor removê-los no Unix. Para imprimir o que a sequência de comandos que você postou imprimiu (com os retornos de carro removidos), tente:

awk '{gsub(/\r/,"")}
     /mod/          { a = $0 }
     /search_string/{ if(a!=""){print(a);a=""}
                      print;getline;print
                    }
    ' infile

Ou como uma linha:

$ awk '{gsub(/\r/,"")}/mod/{a=$0}/search_string/{if(a!=""){print(a);a=""}print;getline;print}' infile

mod start3  
 search_string yada yada  
 hello  
 search_string yada yada  
 bye  
mod start4  
 search_string baba baba  
 this too

Como é possível usar um separador de registros com vários caracteres no (GNU) awk, podemos definir o separador de registros mode imprimir apenas registros que contenham search_string. O printf é necessário para reconstruir o registro original.

Para imprimir o que você postou como "Saída esperada", tente:

awk '/search_string/{printf("mod%s", $0)}' RS=mod infile

Question 3

Se você quiser isso em um script Python:

# Read file into memory.
with open('myfile.txt') as f:
    lines = [line.rstrip() for line in f]

# Loops through lines backwards, looking for string and optionally mod.
output_lines = list()
find_mod = False
for i, line in enumerate(lines[::-1]):
    if 'search_string' in line:
        output_lines.append(lines[::-1][i-1])
        output_lines.append(lines[::-1][i])
        find_mod = True
    elif find_mod and 'mod' in line:
        output_lines.append(lines[::-1][i])
        find_mod=False

print("\n".join(output_lines[::-1]))

Answer

Se você quiser isso em um script Python:

# Read file into memory.
with open('myfile.txt') as f:
    lines = [line.rstrip() for line in f]

# Loops through lines backwards, looking for string and optionally mod.
output_lines = list()
find_mod = False
for i, line in enumerate(lines[::-1]):
    if 'search_string' in line:
        output_lines.append(lines[::-1][i-1])
        output_lines.append(lines[::-1][i])
        find_mod = True
    elif find_mod and 'mod' in line:
        output_lines.append(lines[::-1][i])
        find_mod=False

print("\n".join(output_lines[::-1]))

Combine o padrãoA e imprima-o somente quando o padrãoB corresponder, incluindo a seguinte linha

Responder1

Responder2

Responder3

informação relacionada