awk を使用して行 (レコード) を分割する方法は?

Question 1

dataレコード区切りとして使用し、最後のレコードを印刷するには:

$ awk -v RS=data 'END{print}' File

I J
K L
M N

これには、の複数文字値をサポートする GNU awk (gawk) や mawk などの awk が必要ですRS。

Answer

dataレコード区切りとして使用し、最後のレコードを印刷するには:

$ awk -v RS=data 'END{print}' File

I J
K L
M N

これには、の複数文字値をサポートする GNU awk (gawk) や mawk などの awk が必要ですRS。

Question 2

$ awk '/^data/ { lines = ""; next } { lines = (lines == "" ? $0 : lines ORS $0) } END { print lines }' file
I J
K L
M N

これはawk、文字列で始まる最後の行以降の入力内容を取得するためにを使用しますdata。これは、そのような行の後の各行セクションを変数に保存することによって行われますlines。で始まる行に遭遇するたびにdata、この変数は空になります。入力の最後に到達すると、変数の値が印刷されます。

使用方法sed:

$ sed -n 'H;${ x; s/.*\ndata\n//p; }' file
I J
K L
M N

すべての行をホールドスペースに追加します。最後の行に到達すると、ホールドスペースはパターンスペースにスワップされ、文字列 (両側に改行がある) までのすべてがdata削除されてから、残りのビットが印刷されます。

使用方法ed:

$ printf "?^data?ka\n1,'ad\n,p\nQ\n" | ed -s file
I J
K L
M N

または、

ed -s file <<END_ED
?^data?ka
1,'ad
,p
Q
END_ED

dataここでは、まず、行の先頭で文字列の最後の出現を逆方向に検索し、その行にラベルを付けます (ラベルと呼びますa)。次に、バッファの先頭からラベルの付いた行までを削除します。は、,pバッファの内容全体を単純に出力します。

GNU 以外の場合ed、final Q(保存せずに終了する) はおそらく必要ありません。

Answer

$ awk '/^data/ { lines = ""; next } { lines = (lines == "" ? $0 : lines ORS $0) } END { print lines }' file
I J
K L
M N