Сравнение двух столбцов (числовых) в двух разных текстовых файлах

Question 1

Попробуйте этот awk:

awk '
    NR==FNR{s1[$3]=$1;next}
    {s2[$3]=$1}
    END{
        for (value in s1){
            if (s1[value]!=s2[value]) print s1[value]-s2[value],$2,value
        }
    }
' ram-service1.txt ram-service2.txt | column -t > outfile

Он columnпросто преобразует вывод в удобный формат «диаграммы» и сохраняет его в файл outfile.

Answer

Попробуйте этот awk:

awk '
    NR==FNR{s1[$3]=$1;next}
    {s2[$3]=$1}
    END{
        for (value in s1){
            if (s1[value]!=s2[value]) print s1[value]-s2[value],$2,value
        }
    }
' ram-service1.txt ram-service2.txt | column -t > outfile

Он columnпросто преобразует вывод в удобный формат «диаграммы» и сохраняет его в файл outfile.

Question 2

join -1 3 -2 3 <(sort -k3 file1) <(sort -k3 file2) |
awk '$2 != $4 { printf("%20s:\t%+d\n", $1, $4 - $2) }'

Это объединит файлы на основе имени программы в третьем столбце. Каждый файл сортируется по этому полю, а затем joinсчитывает эти данные и выводит строки, для которых имя программы совпадает в обоих файлах. Вывод этого шага будет выглядеть так:

Program RAM used RAM used
NetworkManager 5370 kb 5450 kb
auditd 734.00 kb 736.00 kb
bash 967.00 kb 941.00 kb
chronyd 1000 kb 1010 kb
crond 741.00 kb 747.00 kb

(и т. д.)

... где первый столбец теперь — это имя программы, второй — номер из первого файла, а четвертый столбец — номер из второго файла.

Программа awk, которая это считывает, проверяет значения в столбцах 2 и 4, и если они различаются, она записывает строку с разницей.

Результат, учитывая данные в вопросе, будет

      NetworkManager:   +80
              auditd:   +2
                bash:   -26
             chronyd:   +10
               crond:   +6
            dhclient:   +60
           firewalld:   +40
               login:   +196
              master:   +10
              pickup:   +50
                  pv:   -3
                qmgr:   +50
         ramusage.sh:   -2
            rsyslogd:   -100
             systemd:   +10
     systemd-journal:   -110
      systemd-logind:   +1
               tuned:   +50

Отрицательное значение означает, что во втором файле оно меньше.

Answer

join -1 3 -2 3 <(sort -k3 file1) <(sort -k3 file2) |
awk '$2 != $4 { printf("%20s:\t%+d\n", $1, $4 - $2) }'