Buscando um bloco de texto com partes que podem ser opcionais

Question 1

Isso resolveria, espero. Os eventos vão para eventsarquivo. E as mensagens vão para stdout.

Salve este arquivo em myprogram.awk (por exemplo):

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

Você pode invocá-lo de diferentes maneiras:

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

Exemplo de saída:

Warning: Event 3 has no Data Entries
Total event count: 3

Você pode verificar todos os eventos juntos no arquivo chamado eventsno diretório de trabalho.

Answer

Isso resolveria, espero. Os eventos vão para eventsarquivo. E as mensagens vão para stdout.

Salve este arquivo em myprogram.awk (por exemplo):

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

Você pode invocá-lo de diferentes maneiras:

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

Exemplo de saída:

Warning: Event 3 has no Data Entries
Total event count: 3

Você pode verificar todos os eventos juntos no arquivo chamado eventsno diretório de trabalho.

Question 2

Uma abordagem muito simples seria

awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" file

Isso criará um arquivo separado para cada entrada e imprimirá o número de entradas encontradas na saída padrão.

Explicação

NRé o número da linha atual em awk.
RS="]]"define o separador de registros (o que define uma "linha") como ]]. Isso significa que cada entrada será tratada como uma única linha por awk.
{print > NR".entry"}: imprime a linha atual (entrada) em um arquivo chamado [LineNumber].entry. Então, 1.entryconterá o 1º, 2.entryo segundo e assim por diante.
END{print NR" entries"}: o bloco END é executado após todo o arquivo de entrada ter sido processado. Portanto, nesse ponto NRserá o número de entradas processadas.

Você pode salvar isso como um alias ou transformá-lo em um script como este:

#!/usr/bin/env bash
awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" "$1"

Você então executaria o script (supondo que ele seja chamado foo.she esteja em seu $PATH) com o arquivo de destino como argumento:

foo.sh file

Você também pode ajustar os nomes dos arquivos de saída. Por exemplo, para que os arquivos sejam chamados, [date].[entry number].[entry]use isto:

#!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{print > d"."NR".entry"}END{print NR" entries"}' RS="]]" d="$date" "$1"

O texto acima pressupõe que seu arquivo de log consiste exclusivamente em entradas de "Eventos". Se esse não for o caso, e você puder ter outras linhas, e essas linhas devem ser ignoradas, use isto:

 #!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{
        if(/\[\[/){a=1; c++;}
        if(/\]\]/){a=0; print > d"."c".entry"}
        if(a==1){print >> d"."c".entry"}
}' d="$date" file

Ou, como uma linha:

awk '{if(/\[\[/){a=1; c++;}if(/\]\]/){a=0; print > d"."c".entry"}if(a==1){print >> d"."c".entry"}}' d=$(date +%Y%m%d) file

Answer

Uma abordagem muito simples seria

awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" file

Isso criará um arquivo separado para cada entrada e imprimirá o número de entradas encontradas na saída padrão.

Explicação

NRé o número da linha atual em awk.
RS="]]"define o separador de registros (o que define uma "linha") como ]]. Isso significa que cada entrada será tratada como uma única linha por awk.
{print > NR".entry"}: imprime a linha atual (entrada) em um arquivo chamado [LineNumber].entry. Então, 1.entryconterá o 1º, 2.entryo segundo e assim por diante.
END{print NR" entries"}: o bloco END é executado após todo o arquivo de entrada ter sido processado. Portanto, nesse ponto NRserá o número de entradas processadas.

Você pode salvar isso como um alias ou transformá-lo em um script como este:

#!/usr/bin/env bash
awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" "$1"

Você então executaria o script (supondo que ele seja chamado foo.she esteja em seu $PATH) com o arquivo de destino como argumento:

foo.sh file

Você também pode ajustar os nomes dos arquivos de saída. Por exemplo, para que os arquivos sejam chamados, [date].[entry number].[entry]use isto:

#!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{print > d"."NR".entry"}END{print NR" entries"}' RS="]]" d="$date" "$1"

O texto acima pressupõe que seu arquivo de log consiste exclusivamente em entradas de "Eventos". Se esse não for o caso, e você puder ter outras linhas, e essas linhas devem ser ignoradas, use isto:

 #!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{
        if(/\[\[/){a=1; c++;}
        if(/\]\]/){a=0; print > d"."c".entry"}
        if(a==1){print >> d"."c".entry"}
}' d="$date" file

Ou, como uma linha:

awk '{if(/\[\[/){a=1; c++;}if(/\]\]/){a=0; print > d"."c".entry"}if(a==1){print >> d"."c".entry"}}' d=$(date +%Y%m%d) file

Buscando um bloco de texto com partes que podem ser opcionais

Responder1

Responder2

Explicação

informação relacionada