Suche nach Duplikaten in der ersten und zweiten Spalte und summiere die Zahlen in der dritten Spalte

Question 1

Verwendung von GNU awk, das über Arrays von Arrays verfügt (erfordert möglicherweise Gawk Version 4)

gawk '
    NF  { n[$1][$2] += $3 }
    END {
        for (name in n) {
            print name ":"
            for (fruit in n[name]) 
                printf "%16s %2d\n", fruit, n[name][fruit]
        }
    }
'

Answer

Verwendung von GNU awk, das über Arrays von Arrays verfügt (erfordert möglicherweise Gawk Version 4)

gawk '
    NF  { n[$1][$2] += $3 }
    END {
        for (name in n) {
            print name ":"
            for (fruit in n[name]) 
                printf "%16s %2d\n", fruit, n[name][fruit]
        }
    }
'

Question 2

Wenn es Ihnen nichts ausmacht, dass die Ausgabe sortiert ist, können Sie die aktuelle Person und die aktuelle Frucht im Auge behalten und summieren, bis sich eines davon ändert:

#!/usr/bin/awk -f

NF {
    if (who != $1) {
        if (count > 0) {
            printf "%16s %2d\n", fruit, count
        }
        who = $1
        printf "%s:\n", who
        fruit = ""
        count = 0
    }
    if (fruit != $2) {
        if (count > 0) {
            printf "%16s %2d\n", fruit, count
        }
        fruit = $2
        count = $3
    } else {
        count += $3
    }
}

END {
    printf "%16s %2d\n", fruit, count
}

Füttern Sie dies mit sort -k1,1 -k2,2:

sort -k1,1 -k2,2 file.txt | ./script.awk

Answer

Wenn es Ihnen nichts ausmacht, dass die Ausgabe sortiert ist, können Sie die aktuelle Person und die aktuelle Frucht im Auge behalten und summieren, bis sich eines davon ändert:

#!/usr/bin/awk -f

NF {
    if (who != $1) {
        if (count > 0) {
            printf "%16s %2d\n", fruit, count
        }
        who = $1
        printf "%s:\n", who
        fruit = ""
        count = 0
    }
    if (fruit != $2) {
        if (count > 0) {
            printf "%16s %2d\n", fruit, count
        }
        fruit = $2
        count = $3
    } else {
        count += $3
    }
}

END {
    printf "%16s %2d\n", fruit, count
}

Füttern Sie dies mit sort -k1,1 -k2,2:

sort -k1,1 -k2,2 file.txt | ./script.awk

Suche nach Duplikaten in der ersten und zweiten Spalte und summiere die Zahlen in der dritten Spalte

Antwort1

Antwort2

verwandte Informationen