awk compara una matriz con otra en la línea anterior

Question

Los datos de entrada proporcionados como URL en un comentario están delimitados por tabulaciones. Esto significa que podemos analizar su primer campo delimitado por tabulaciones como una especie de "clave" para comparar con otras líneas. Hacemosnodebe preocuparse por las palabras separadas por espacios dentro del primer campo, pero puede tratar todo el primer campo como una sola entidad.

BEGIN { OFS = FS = "\t" }

{
    count = $(NF - 1)
    key = $1
}

key != previous {
    if (previous != "")
        print previous, sum

    sum = 0
}

{
    sum += count
    previous = key
}

END {
    if (previous != "")
        print previous, sum
}

Este awkprograma analiza el campo "recuento" (penúltimo campo) y countluego utiliza el primer campo como "clave" para compararlo posteriormente con la clave de la línea anterior. Este es el primer bloque después del BEGINbloque (que simplemente establece delimitadores de entrada y salida).

Si la clave es diferente de la clave de la línea anterior, esto significa que ahora estamos viendo otro conjunto de palabras. Genere la clave y la suma de la línea anterior y restablezca la suma.

Para todas las líneas, incremente la suma por el recuento de esta línea y actualice previous(ahora hemos terminado con esta línea, por lo que esta línea keyes la siguiente previous).

Al final, genere la información de la última línea de los datos.

Ejecutarías esto usando awk -f script.awk inputfile.

Como "una sola línea":

awk -F '\t' 'BEGIN{OFS=FS} {c=$(NF-1);k=$1} k!=p {if(p!="")print p,s;s=0} {s+=c;p=k} END {if(p!="") print p,s}' file

Answer 1