Comparando duas colunas (numéricas) em dois arquivos de texto diferentes

Question 1

Tente isso:

awk '
    NR==FNR{s1[$3]=$1;next}
    {s2[$3]=$1}
    END{
        for (value in s1){
            if (s1[value]!=s2[value]) print s1[value]-s2[value],$2,value
        }
    }
' ram-service1.txt ram-service2.txt | column -t > outfile

Ele columnapenas coloca a saída em um formato de "gráfico" agradável e salva-a no formato outfile.

Answer

Tente isso:

awk '
    NR==FNR{s1[$3]=$1;next}
    {s2[$3]=$1}
    END{
        for (value in s1){
            if (s1[value]!=s2[value]) print s1[value]-s2[value],$2,value
        }
    }
' ram-service1.txt ram-service2.txt | column -t > outfile

Ele columnapenas coloca a saída em um formato de "gráfico" agradável e salva-a no formato outfile.

Question 2

join -1 3 -2 3 <(sort -k3 file1) <(sort -k3 file2) |
awk '$2 != $4 { printf("%20s:\t%+d\n", $1, $4 - $2) }'

Isso juntaria os arquivos com base no nome do programa na terceira coluna. Cada arquivo é classificado neste campo e, em seguida, joinlê esses dados e gera as linhas para as quais o nome do programa corresponde em ambos os arquivos. A saída dessa etapa seria semelhante

Program RAM used RAM used
NetworkManager 5370 kb 5450 kb
auditd 734.00 kb 736.00 kb
bash 967.00 kb 941.00 kb
chronyd 1000 kb 1010 kb
crond 741.00 kb 747.00 kb

(etc.)

... onde a primeira coluna agora é o nome do programa, a segunda é o número do primeiro arquivo e a quarta coluna é o número do segundo arquivo.

O awkprograma que lê testa os valores das colunas 2 e 4 e, se forem diferentes, escreve uma linha com a diferença.

O resultado, dados os dados da questão, será

      NetworkManager:   +80
              auditd:   +2
                bash:   -26
             chronyd:   +10
               crond:   +6
            dhclient:   +60
           firewalld:   +40
               login:   +196
              master:   +10
              pickup:   +50
                  pv:   -3
                qmgr:   +50
         ramusage.sh:   -2
            rsyslogd:   -100
             systemd:   +10
     systemd-journal:   -110
      systemd-logind:   +1
               tuned:   +50

Um valor negativo significa que é menor no segundo arquivo.

Answer

join -1 3 -2 3 <(sort -k3 file1) <(sort -k3 file2) |
awk '$2 != $4 { printf("%20s:\t%+d\n", $1, $4 - $2) }'