Поиск блока текста с частями, которые могут быть необязательными

Question 1

Надеюсь, это сработает. События отправляются в eventsфайл. А сообщения отправляются в stdout.

Сохраните этот файл в myprogram.awk (например):

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

Вызвать его можно разными способами:

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

Пример вывода:

Warning: Event 3 has no Data Entries
Total event count: 3

Вы можете проверить все события вместе в файле, который находится eventsв рабочем каталоге.

Answer

Надеюсь, это сработает. События отправляются в eventsфайл. А сообщения отправляются в stdout.

Сохраните этот файл в myprogram.awk (например):

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

Вызвать его можно разными способами:

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

Пример вывода:

Warning: Event 3 has no Data Entries
Total event count: 3

Вы можете проверить все события вместе в файле, который находится eventsв рабочем каталоге.

Question 2

Очень простой подход был бы

awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" file

Это создаст отдельный файл для каждой записи и выведет количество найденных записей на стандартный вывод.

Объяснение

NR— это текущий номер строки в awk.
RS="]]"устанавливает разделитель записей (то, что определяет "строку") на ]]. Это означает, что каждая запись будет рассматриваться как одна строка awk.
{print > NR".entry"}: это печатает текущую строку (запись) в файл с именем [LineNumber].entry. Таким образом, 1.entryбудет содержать 1-ю, 2.entryвторую и т. д.
END{print NR" entries"}: блок END выполняется после обработки всего входного файла. Таким образом, в этой точке NRбудет количество обработанных записей.

Вы можете сохранить это как псевдоним или превратить в скрипт, например, так:

#!/usr/bin/env bash
awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" "$1"

Затем вы запускаете скрипт (предполагая, что он вызван foo.shи находится в вашем $PATH) с целевым файлом в качестве аргумента:

foo.sh file

Вы также можете изменить имена выходных файлов. Например, чтобы файлы назывались, [date].[entry number].[entry]используйте это:

#!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{print > d"."NR".entry"}END{print NR" entries"}' RS="]]" d="$date" "$1"

Вышеизложенное предполагает, что ваш файл журнала состоит исключительно из записей "Событие". Если это не так, и у вас могут быть другие строки, и эти строки следует игнорировать, используйте это вместо этого:

 #!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{
        if(/\[\[/){a=1; c++;}
        if(/\]\]/){a=0; print > d"."c".entry"}
        if(a==1){print >> d"."c".entry"}
}' d="$date" file

Или, вкратце:

awk '{if(/\[\[/){a=1; c++;}if(/\]\]/){a=0; print > d"."c".entry"}if(a==1){print >> d"."c".entry"}}' d=$(date +%Y%m%d) file

Answer

Очень простой подход был бы

awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" file

Это создаст отдельный файл для каждой записи и выведет количество найденных записей на стандартный вывод.

Объяснение

NR— это текущий номер строки в awk.
RS="]]"устанавливает разделитель записей (то, что определяет "строку") на ]]. Это означает, что каждая запись будет рассматриваться как одна строка awk.
{print > NR".entry"}: это печатает текущую строку (запись) в файл с именем [LineNumber].entry. Таким образом, 1.entryбудет содержать 1-ю, 2.entryвторую и т. д.
END{print NR" entries"}: блок END выполняется после обработки всего входного файла. Таким образом, в этой точке NRбудет количество обработанных записей.

Вы можете сохранить это как псевдоним или превратить в скрипт, например, так:

#!/usr/bin/env bash
awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" "$1"

Затем вы запускаете скрипт (предполагая, что он вызван foo.shи находится в вашем $PATH) с целевым файлом в качестве аргумента:

foo.sh file

Вы также можете изменить имена выходных файлов. Например, чтобы файлы назывались, [date].[entry number].[entry]используйте это:

#!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{print > d"."NR".entry"}END{print NR" entries"}' RS="]]" d="$date" "$1"

Вышеизложенное предполагает, что ваш файл журнала состоит исключительно из записей "Событие". Если это не так, и у вас могут быть другие строки, и эти строки следует игнорировать, используйте это вместо этого:

 #!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{
        if(/\[\[/){a=1; c++;}
        if(/\]\]/){a=0; print > d"."c".entry"}
        if(a==1){print >> d"."c".entry"}
}' d="$date" file

Или, вкратце:

awk '{if(/\[\[/){a=1; c++;}if(/\]\]/){a=0; print > d"."c".entry"}if(a==1){print >> d"."c".entry"}}' d=$(date +%Y%m%d) file

Поиск блока текста с частями, которые могут быть необязательными

решение1

решение2

Объяснение

Связанный контент