선택 사항이 될 수 있는 부분이 포함된 텍스트 블록 찾기

Question 1

이것이면 좋겠다. 이벤트는 파일로 이동합니다 events. 그리고 메시지는 stdout으로 이동합니다.

이 파일을 myprogram.awk에 저장합니다(예:).

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

다양한 방법으로 호출할 수 있습니다.

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

샘플 출력:

Warning: Event 3 has no Data Entries
Total event count: 3

events작업 디렉토리에 호출된 파일에서 모든 이벤트를 함께 확인할 수 있습니다 .

Answer

이것이면 좋겠다. 이벤트는 파일로 이동합니다 events. 그리고 메시지는 stdout으로 이동합니다.

이 파일을 myprogram.awk에 저장합니다(예:).

#!/usr/bin/awk -f

BEGIN {
   s=0;  ### state. Active when parsing inside an event
   nevent=0;  ### Current event number
   printf "" > "events"
}

# Start of event
/^ *Data control raising event/ {
   s=1;
   dentries=0;
   print "*** Event number: " nevent >> "events"
   nevent++
}

# Standard event line
s==1 {
   print >> "events"
}

# DataChangeEntry line
/^ *==== DataChangeEntry/ {
   dentries ++
}

# End of event
s==1 && /^ *\]\]/ {
   s=0;
   print "" >> "events"
   if(dentries==0){
      print "Warning: Event " nevent " has no Data Entries"
   }
}

END {
   print "Total event count: " nevent
}

다양한 방법으로 호출할 수 있습니다.

myprogram.awk inputfile.txt
awk -f myprogram.awk inputfile.txt

샘플 출력:

Warning: Event 3 has no Data Entries
Total event count: 3

events작업 디렉토리에 호출된 파일에서 모든 이벤트를 함께 확인할 수 있습니다 .

Question 2

매우 간단한 접근 방식은 다음과 같습니다.

awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" file

그러면 각 항목에 대해 별도의 파일이 생성되고 발견된 항목 수가 표준 출력으로 인쇄됩니다.

설명

NR의 현재 줄 번호입니다 awk.
RS="]]"레코드 구분 기호("줄"을 정의하는 것)를 로 설정합니다 ]]. 즉, 각 항목은 에서 한 줄로 처리됩니다 awk.
{print > NR".entry"}: 현재 행(항목)을 이라는 파일에 인쇄합니다 [LineNumber].entry. 따라서 1.entry첫 번째, 2.entry두 번째 등이 포함됩니다.
END{print NR" entries"}: 전체 입력 파일이 처리된 후 END 블록이 실행됩니다. 따라서 해당 시점에서 NR처리되는 항목 수가 됩니다.

이것을 별칭으로 저장하거나 다음과 같이 스크립트로 만들 수 있습니다.

#!/usr/bin/env bash
awk '{print > NR".entry"}END{print NR" entries"}' RS="]]" "$1"

foo.sh그런 다음 대상 파일을 인수로 사용하여 스크립트를 실행합니다(이 스크립트가 호출되고 $PATH에 있다고 가정 ).

foo.sh file

출력 파일 이름을 조정할 수도 있습니다. 예를 들어 파일을 호출하려면 [date].[entry number].[entry]다음을 대신 사용하세요.

#!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{print > d"."NR".entry"}END{print NR" entries"}' RS="]]" d="$date" "$1"

위의 내용에서는 로그 파일이 "이벤트" 항목으로만 구성되어 있다고 가정합니다. 그렇지 않고 다른 줄이 있을 수 있고 해당 줄을 무시해야 하는 경우 대신 다음을 사용하십시오.

 #!/usr/bin/env bash
date=$(date +%Y%m%d)
awk '{
        if(/\[\[/){a=1; c++;}
        if(/\]\]/){a=0; print > d"."c".entry"}
        if(a==1){print >> d"."c".entry"}
}' d="$date" file

또는 한 줄로 다음과 같이 하십시오.

awk '{if(/\[\[/){a=1; c++;}if(/\]\]/){a=0; print > d"."c".entry"}if(a==1){print >> d"."c".entry"}}' d=$(date +%Y%m%d) file

Answer