awk compara array com array na linha anterior

Question

Os dados de entrada fornecidos como URL em um comentário são delimitados por tabulações. Isso significa que podemos analisar seu primeiro campo delimitado por tabulação como uma espécie de "chave" para comparar com outras linhas. Nós fazemosnãotem que se preocupar com as palavras separadas por espaço no primeiro campo, mas pode tratar todo o primeiro campo como uma entidade única.

BEGIN { OFS = FS = "\t" }

{
    count = $(NF - 1)
    key = $1
}

key != previous {
    if (previous != "")
        print previous, sum

    sum = 0
}

{
    sum += count
    previous = key
}

END {
    if (previous != "")
        print previous, sum
}

Este awkprograma analisa o campo "contagem" (penúltimo campo) em e count, em seguida, usa o primeiro campo como a "chave" para comparar posteriormente com a chave da linha anterior. Este é o primeiro bloco após o BEGINbloco (que apenas define os delimitadores de entrada e saída).

Se a tonalidade for diferente da tonalidade da linha anterior, isso significa que agora estamos olhando para algum outro conjunto de palavras. Produza a chave e a soma da linha anterior e redefina a soma.

Para todas as linhas, aumente a soma pela contagem desta linha e atualize previous(agora terminamos esta linha, então esta linha keyé a próxima previous).

No final, produza as informações da última linha dos dados.

Você executaria isso usando awk -f script.awk inputfile.

Como uma "linha única":

awk -F '\t' 'BEGIN{OFS=FS} {c=$(NF-1);k=$1} k!=p {if(p!="")print p,s;s=0} {s+=c;p=k} END {if(p!="") print p,s}' file

Answer 1