オプション部分を含むテキストブロックをGrepする

Question 1

これでうまくいくと思います。イベントはeventsファイルに送られます。メッセージは標準出力に送られます。

このファイルを myprogram.awk に保存します (例):

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

さまざまな方法で呼び出すことができます:

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

サンプル出力:

Warning: Event 3 has no Data Entries
Total event count: 3

events作業ディレクトリにあるファイルですべてのイベントをまとめて確認できます。

Answer

これでうまくいくと思います。イベントはeventsファイルに送られます。メッセージは標準出力に送られます。

このファイルを myprogram.awk に保存します (例):

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

さまざまな方法で呼び出すことができます:

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

サンプル出力:

Warning: Event 3 has no Data Entries
Total event count: 3

events作業ディレクトリにあるファイルですべてのイベントをまとめて確認できます。

Question 2

非常にシンプルなアプローチは

awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" file

これにより、エントリごとに個別のファイルが作成され、見つかったエントリの数を標準出力に出力します。

説明

NRは、内の現在の行番号ですawk。
RS="]]"レコード区切り文字 (「行」を定義するもの) をに設定します]]。つまり、各エントリはによって 1 行として扱われますawk。
{print > NR".entry"}: これは、現在の行 (エントリ) をというファイルに出力します[LineNumber].entry。したがって、に1.entryは 1 番目、2.entry2 番目などが含まれます。
END{print NR" entries"}: END ブロックは、入力ファイル全体が処理された後に実行されます。したがって、その時点では、NR処理されたエントリの数がになります。

これをエイリアスとして保存するか、次のようにスクリプトにすることができます。

#!/usr/bin/env bash
awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" "$1"

foo.sh次に、ターゲットファイルを引数としてスクリプトを実行します (スクリプトが呼び出され、$PATH 内にあると仮定します)。

foo.sh file

出力ファイル名を微調整することもできます。たとえば、ファイル名を次のようにするには、[date].[entry number].[entry]代わりに次のようにします。

#!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{print > d"."NR".entry"}END{print NR" entries"}' RS="]]" d="$date" "$1"

上記は、ログファイルが「イベント」エントリのみで構成されていることを前提としています。そうでない場合、他の行が存在し、それらの行を無視する必要がある場合は、代わりに以下を使用します。

 #!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{
        if(/\[\[/){a=1; c++;}
        if(/\]\]/){a=0; print > d"."c".entry"}
        if(a==1){print >> d"."c".entry"}
}' d="$date" file

あるいは、一言で言えば:

awk '{if(/\[\[/){a=1; c++;}if(/\]\]/){a=0; print > d"."c".entry"}if(a==1){print >> d"."c".entry"}}' d=$(date +%Y%m%d) file

Answer