Vergleichen zweier Spalten (numerisch) in zwei verschiedenen Textdateien

Question 1

Versuchen Sie Folgendes, awk:

awk '
    NR==FNR{s1[$3]=$1;next}
    {s2[$3]=$1}
    END{
        for (value in s1){
            if (s1[value]!=s2[value]) print s1[value]-s2[value],$2,value
        }
    }
' ram-service1.txt ram-service2.txt | column -t > outfile

Es columnbringt die Ausgabe einfach in ein schönes „Diagramm“-Format und speichert sie unter outfile.

Answer

Versuchen Sie Folgendes, awk:

awk '
    NR==FNR{s1[$3]=$1;next}
    {s2[$3]=$1}
    END{
        for (value in s1){
            if (s1[value]!=s2[value]) print s1[value]-s2[value],$2,value
        }
    }
' ram-service1.txt ram-service2.txt | column -t > outfile

Es columnbringt die Ausgabe einfach in ein schönes „Diagramm“-Format und speichert sie unter outfile.

Question 2

join -1 3 -2 3 <(sort -k3 file1) <(sort -k3 file2) |
awk '$2 != $4 { printf("%20s:\t%+d\n", $1, $4 - $2) }'

Dies würde die Dateien basierend auf dem Programmnamen in der dritten Spalte zusammenführen. Jede Datei wird nach diesem Feld sortiert und joinliest dann diese Daten und gibt die Zeilen aus, für die der Programmname in beiden Dateien übereinstimmt. Die Ausgabe dieses Schritts würde wie folgt aussehen:

Program RAM used RAM used
NetworkManager 5370 kb 5450 kb
auditd 734.00 kb 736.00 kb
bash 967.00 kb 941.00 kb
chronyd 1000 kb 1010 kb
crond 741.00 kb 747.00 kb

(usw.)

... wobei die erste Spalte nun den Programmnamen, die zweite die Nummer aus der ersten Datei und die vierte Spalte die Nummer aus der zweiten Datei ist.

Das awkProgramm, das dies liest, prüft die Werte in Spalte 2 und 4 und schreibt, falls diese unterschiedlich sind, eine Zeile mit der Differenz.

Das Ergebnis wird, unter Berücksichtigung der Daten in der Frage, sein

      NetworkManager:   +80
              auditd:   +2
                bash:   -26
             chronyd:   +10
               crond:   +6
            dhclient:   +60
           firewalld:   +40
               login:   +196
              master:   +10
              pickup:   +50
                  pv:   -3
                qmgr:   +50
         ramusage.sh:   -2
            rsyslogd:   -100
             systemd:   +10
     systemd-journal:   -110
      systemd-logind:   +1
               tuned:   +50

Ein negativer Wert bedeutet, dass es in der zweiten Datei kleiner ist.

Answer

join -1 3 -2 3 <(sort -k3 file1) <(sort -k3 file2) |
awk '$2 != $4 { printf("%20s:\t%+d\n", $1, $4 - $2) }'