1 列目と 2 列目の重複を検索し、3 列目の数値を合計します。

Question 1

配列の配列を持つ GNU awk を使用する (gawk バージョン 4 が必要になる場合があります)

gawk '
    NF  { n[$1][$2] += $3 }
    END {
        for (name in n) {
            print name ":"
            for (fruit in n[name]) 
                printf "%16s %2d\n", fruit, n[name][fruit]
        }
    }
'

Answer

配列の配列を持つ GNU awk を使用する (gawk バージョン 4 が必要になる場合があります)

gawk '
    NF  { n[$1][$2] += $3 }
    END {
        for (name in n) {
            print name ":"
            for (fruit in n[name]) 
                printf "%16s %2d\n", fruit, n[name][fruit]
        }
    }
'

Question 2

出力がソートされていても構わない場合は、現在の人物と現在の果物を追跡し、どちらかが変化するまで合計することができます。

#!/usr/bin/awk -f

NF {
    if (who != $1) {
        if (count > 0) {
            printf "%16s %2d\n", fruit, count
        }
        who = $1
        printf "%s:\n", who
        fruit = ""
        count = 0
    }
    if (fruit != $2) {
        if (count > 0) {
            printf "%16s %2d\n", fruit, count
        }
        fruit = $2
        count = $3
    } else {
        count += $3
    }
}

END {
    printf "%16s %2d\n", fruit, count
}

これを次のようにフィードしますsort -k1,1 -k2,2:

sort -k1,1 -k2,2 file.txt | ./script.awk

Answer

出力がソートされていても構わない場合は、現在の人物と現在の果物を追跡し、どちらかが変化するまで合計することができます。

#!/usr/bin/awk -f

NF {
    if (who != $1) {
        if (count > 0) {
            printf "%16s %2d\n", fruit, count
        }
        who = $1
        printf "%s:\n", who
        fruit = ""
        count = 0
    }
    if (fruit != $2) {
        if (count > 0) {
            printf "%16s %2d\n", fruit, count
        }
        fruit = $2
        count = $3
    } else {
        count += $3
    }
}

END {
    printf "%16s %2d\n", fruit, count
}

これを次のようにフィードしますsort -k1,1 -k2,2:

sort -k1,1 -k2,2 file.txt | ./script.awk

1 列目と 2 列目の重複を検索し、3 列目の数値を合計します。

答え1

答え2

関連情報