Suchen nach einem Textblock mit Teilen, die optional sein können

Question 1

Ich hoffe, das würde es tun. Ereignisse werden in eventseine Datei geschrieben. Und Nachrichten werden an die Standardausgabe gesendet.

Speichern Sie diese Datei beispielsweise in myprogram.awk:

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

Sie können es auf verschiedene Arten aufrufen:

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

Beispielausgabe:

Warning: Event 3 has no Data Entries
Total event count: 3

Sie können alle Ereignisse zusammen in der Datei eventsim Arbeitsverzeichnis überprüfen.

Answer

Ich hoffe, das würde es tun. Ereignisse werden in eventseine Datei geschrieben. Und Nachrichten werden an die Standardausgabe gesendet.

Speichern Sie diese Datei beispielsweise in myprogram.awk:

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

Sie können es auf verschiedene Arten aufrufen:

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

Beispielausgabe:

Warning: Event 3 has no Data Entries
Total event count: 3

Sie können alle Ereignisse zusammen in der Datei eventsim Arbeitsverzeichnis überprüfen.

Question 2

Ein sehr einfacher Ansatz wäre

awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" file

Dadurch wird für jeden Eintrag eine separate Datei erstellt und die Anzahl der gefundenen Einträge in der Standardausgabe gedruckt.

Erläuterung

NRist die aktuelle Zeilennummer in awk.
RS="]]"setzt den Datensatztrenner (was eine „Zeile“ definiert) auf ]]. Das bedeutet, dass jeder Eintrag von als einzelne Zeile behandelt wird awk.
{print > NR".entry"}: Dadurch wird die aktuelle Zeile (Eintrag) in eine Datei mit dem Namen gedruckt [LineNumber].entry. 1.entrySie enthält also die 1., 2.entrydie 2. usw.
END{print NR" entries"}: Der END-Block wird ausgeführt, nachdem die gesamte Eingabedatei verarbeitet wurde. Daher NRwird an diesem Punkt die Anzahl der verarbeiteten Einträge angezeigt.

Sie können dies als Alias speichern oder wie folgt in ein Skript umwandeln:

#!/usr/bin/env bash
awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" "$1"

Anschließend führen Sie das Skript (vorausgesetzt, es wird aufgerufen foo.shund befindet sich in Ihrem $PATH) mit der Zieldatei als Argument aus:

foo.sh file

Sie können auch die Namen der Ausgabedateien anpassen. Um die Dateien beispielsweise [date].[entry number].[entry]folgendermaßen zu benennen:

#!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{print > d"."NR".entry"}END{print NR" entries"}' RS="]]" d="$date" "$1"

Das Obige setzt voraus, dass Ihre Protokolldatei ausschließlich aus „Ereignis“-Einträgen besteht. Wenn das nicht der Fall ist und Sie andere Zeilen haben können und diese Zeilen ignoriert werden sollen, verwenden Sie stattdessen Folgendes:

 #!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{
        if(/\[\[/){a=1; c++;}
        if(/\]\]/){a=0; print > d"."c".entry"}
        if(a==1){print >> d"."c".entry"}
}' d="$date" file

Oder als Einzeiler:

awk '{if(/\[\[/){a=1; c++;}if(/\]\]/){a=0; print > d"."c".entry"}if(a==1){print >> d"."c".entry"}}' d=$(date +%Y%m%d) file

Answer

Ein sehr einfacher Ansatz wäre

awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" file

Dadurch wird für jeden Eintrag eine separate Datei erstellt und die Anzahl der gefundenen Einträge in der Standardausgabe gedruckt.

Erläuterung

NRist die aktuelle Zeilennummer in awk.
RS="]]"setzt den Datensatztrenner (was eine „Zeile“ definiert) auf ]]. Das bedeutet, dass jeder Eintrag von als einzelne Zeile behandelt wird awk.
{print > NR".entry"}: Dadurch wird die aktuelle Zeile (Eintrag) in eine Datei mit dem Namen gedruckt [LineNumber].entry. 1.entrySie enthält also die 1., 2.entrydie 2. usw.
END{print NR" entries"}: Der END-Block wird ausgeführt, nachdem die gesamte Eingabedatei verarbeitet wurde. Daher NRwird an diesem Punkt die Anzahl der verarbeiteten Einträge angezeigt.

Sie können dies als Alias speichern oder wie folgt in ein Skript umwandeln:

#!/usr/bin/env bash
awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" "$1"

Anschließend führen Sie das Skript (vorausgesetzt, es wird aufgerufen foo.shund befindet sich in Ihrem $PATH) mit der Zieldatei als Argument aus:

foo.sh file

Sie können auch die Namen der Ausgabedateien anpassen. Um die Dateien beispielsweise [date].[entry number].[entry]folgendermaßen zu benennen:

#!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{print > d"."NR".entry"}END{print NR" entries"}' RS="]]" d="$date" "$1"

Das Obige setzt voraus, dass Ihre Protokolldatei ausschließlich aus „Ereignis“-Einträgen besteht. Wenn das nicht der Fall ist und Sie andere Zeilen haben können und diese Zeilen ignoriert werden sollen, verwenden Sie stattdessen Folgendes:

 #!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{
        if(/\[\[/){a=1; c++;}
        if(/\]\]/){a=0; print > d"."c".entry"}
        if(a==1){print >> d"."c".entry"}
}' d="$date" file

Oder als Einzeiler:

awk '{if(/\[\[/){a=1; c++;}if(/\]\]/){a=0; print > d"."c".entry"}if(a==1){print >> d"."c".entry"}}' d=$(date +%Y%m%d) file

Suchen nach einem Textblock mit Teilen, die optional sein können

Antwort1

Antwort2

Erläuterung

verwandte Informationen