awk は配列を前の行の配列と比較します

Question

コメント内のURLとして与えられた入力データはタブで区切られています。つまり、最初のタブで区切られたフィールドを他の行と比較するための「キー」として解析することができます。ない最初のフィールド内のスペースで区切られた単語を考慮する必要がありますが、最初のフィールド全体を単一のエンティティとして扱うことができます。

BEGIN { OFS = FS = "\t" }

{
    count = $(NF - 1)
    key = $1
}

key != previous {
    if (previous != "")
        print previous, sum

    sum = 0
}

{
    sum += count
    previous = key
}

END {
    if (previous != "")
        print previous, sum
}

このawkプログラムは、「count」フィールド (最後から 2 番目のフィールド) をに解析し、最初のフィールドを「キー」として使用して、後で前の行のキーと比較します。これは、ブロック (入力と出力の区切り文字を設定するだけ)countの後の最初のブロックです。BEGIN

キーが前の行のキーと異なる場合は、別の単語セットを参照していることを意味します。前の行のキーと合計を出力し、合計をリセットします。

すべての行について、この行からのカウントで合計を増分し、更新しますprevious(この行は終了したので、この行のはkey次の行のになりますprevious)。

最後に、データの最後の行の情報を出力します。

これをを使って実行しますawk -f script.awk inputfile。

「ワンライナー」として：

awk -F '\t' 'BEGIN{OFS=FS} {c=$(NF-1);k=$1} k!=p {if(p!="")print p,s;s=0} {s+=c;p=k} END {if(p!="") print p,s}' file

Answer 1