Comparando dos columnas (numéricas) en dos archivos de texto diferentes

Question 1

Prueba esto:

awk '
    NR==FNR{s1[$3]=$1;next}
    {s2[$3]=$1}
    END{
        for (value in s1){
            if (s1[value]!=s2[value]) print s1[value]-s2[value],$2,value
        }
    }
' ram-service1.txt ram-service2.txt | column -t > outfile

Simplemente columncoloca el resultado en un bonito formato de "gráfico" y lo guarda en outfile.

Answer

Prueba esto:

awk '
    NR==FNR{s1[$3]=$1;next}
    {s2[$3]=$1}
    END{
        for (value in s1){
            if (s1[value]!=s2[value]) print s1[value]-s2[value],$2,value
        }
    }
' ram-service1.txt ram-service2.txt | column -t > outfile

Simplemente columncoloca el resultado en un bonito formato de "gráfico" y lo guarda en outfile.

Question 2

join -1 3 -2 3 <(sort -k3 file1) <(sort -k3 file2) |
awk '$2 != $4 { printf("%20s:\t%+d\n", $1, $4 - $2) }'

Esto uniría los archivos según el nombre del programa en la tercera columna. Cada archivo se ordena en este campo y luego joinlee esos datos y genera las líneas para las cuales el nombre del programa coincide en ambos archivos. El resultado de ese paso se vería así

Program RAM used RAM used
NetworkManager 5370 kb 5450 kb
auditd 734.00 kb 736.00 kb
bash 967.00 kb 941.00 kb
chronyd 1000 kb 1010 kb
crond 741.00 kb 747.00 kb

(etc.)

... donde la primera columna ahora es el nombre del programa, la segunda es el número del primer archivo y la cuarta columna es el número del segundo archivo.

El awkprograma que lee esto prueba los valores de las columnas 2 y 4, y si son diferentes escribe una línea con la diferencia.

El resultado, dados los datos de la pregunta, será

      NetworkManager:   +80
              auditd:   +2
                bash:   -26
             chronyd:   +10
               crond:   +6
            dhclient:   +60
           firewalld:   +40
               login:   +196
              master:   +10
              pickup:   +50
                  pv:   -3
                qmgr:   +50
         ramusage.sh:   -2
            rsyslogd:   -100
             systemd:   +10
     systemd-journal:   -110
      systemd-logind:   +1
               tuned:   +50

Un valor negativo significa que es más pequeño en el segundo archivo.

Answer

join -1 3 -2 3 <(sort -k3 file1) <(sort -k3 file2) |
awk '$2 != $4 { printf("%20s:\t%+d\n", $1, $4 - $2) }'