尋找包含可選部分的文字區塊

Question 1

我希望這能做到。事件進入events檔案。訊息會傳送到標準輸出。

將此檔案儲存到 myprogram.awk（例如）：

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

您可以透過不同的方式調用它：

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

範例輸出：

Warning: Event 3 has no Data Entries
Total event count: 3

您可以在工作目錄中呼叫的檔案中一起檢查所有事件events。

Answer

我希望這能做到。事件進入events檔案。訊息會傳送到標準輸出。

將此檔案儲存到 myprogram.awk（例如）：

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

您可以透過不同的方式調用它：

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

範例輸出：

Warning: Event 3 has no Data Entries
Total event count: 3

您可以在工作目錄中呼叫的檔案中一起檢查所有事件events。

Question 2

一個非常簡單的方法是

awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" file

這將為每個條目建立一個單獨的文件，並將找到的條目數列印到標準輸出。

解釋

NR是中的目前行號awk。
RS="]]"將記錄分隔符號（定義「行」的內容）設為]]。這意味著每個條目將被視為一行awk。
{print > NR".entry"}：這會將目前行（條目）列印到名為[LineNumber].entry.因此，1.entry將包含第一個、2.entry第二個等等。
END{print NR" entries"}：處理完整個輸入檔後執行 END 區塊。因此，此時NR將是處理的條目數。

您可以將其儲存為別名或將其放入腳本中，如下所示：

#!/usr/bin/env bash
awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" "$1"

foo.sh然後，您可以使用目標檔案作為參數來執行腳本（假設它被呼叫並且位於您的 $PATH 中）：

foo.sh file

您也可以調整輸出檔名。例如，要呼叫文件，請[date].[entry number].[entry]使用以下命令：

#!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{print > d"."NR".entry"}END{print NR" entries"}' RS="]]" d="$date" "$1"

上面假設您的日誌檔案僅包含“事件”條目。如果情況並非如此，並且您可以有其他行，並且應忽略這些行，請改用：

 #!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{
        if(/\[\[/){a=1; c++;}
        if(/\]\]/){a=0; print > d"."c".entry"}
        if(a==1){print >> d"."c".entry"}
}' d="$date" file

或者，作為一句話：

awk '{if(/\[\[/){a=1; c++;}if(/\]\]/){a=0; print > d"."c".entry"}if(a==1){print >> d"."c".entry"}}' d=$(date +%Y%m%d) file

Answer