awk 將陣列與上一行的陣列進行比較

Question

註釋中作為 URL 給出的輸入資料以製表符分隔。這意味著我們可以將其第一個製表符分隔欄位解析為一種“鍵”，以便與其他行進行比較。我們的確是不是必須關心第一個欄位中的空格分隔的單字，但可以將整個第一個欄位視為單一實體。

BEGIN { OFS = FS = "\t" }

{
    count = $(NF - 1)
    key = $1
}

key != previous {
    if (previous != "")
        print previous, sum

    sum = 0
}

{
    sum += count
    previous = key
}

END {
    if (previous != "")
        print previous, sum
}

程式awk將“count”欄位（倒數第二個欄位）解析為count，然後使用第一個欄位作為“鍵”，以便稍後與上一行的鍵進行比較。這是該區塊之後的第一個區塊BEGIN（僅設定輸入和輸出分隔符號）。

如果該鍵與上一行的鍵不同，則表示我們現在正在查看其他一些單字集。輸出上一行的key和sum，並重置sum。

對於所有行，將總和增加該行的計數，然後更新previous（我們現在已完成該行，因此該行是key下一行的previous）。

最後，輸出資料中最後一行的資訊。

您可以使用來運行它awk -f script.awk inputfile。

作為“一行”：

awk -F '\t' 'BEGIN{OFS=FS} {c=$(NF-1);k=$1} k!=p {if(p!="")print p,s;s=0} {s+=c;p=k} END {if(p!="") print p,s}' file

Answer 1