Vergleichen von Textdateien mit Bash und AWK

Question 1

Dieser gibt die Zeilen aus Datei2 aus, deren Name in beiden Dateien vorkommt, aber einige der Werte unterschiedlich sind

awk 'NR==FNR {f1[$1]=$0; next} $1 in f1 && $0 != f1[$1]' file1.txt file2.txt

row2  1     4     11        
row1  2     5     12

Mir ist aufgefallen, dass selbst ein Unterschied in den Leerzeichen zu falschen Ergebnissen führt. Wir können die Zeilen „normalisieren“:

awk '
    NR==FNR  {$1=$1; f1[$1]=$0; next} 
    $1 in f1 {$1=$1; if ($0 != f1[$1]) print}
' file1.txt file2.txt

row2 1 4 11
row1 2 5 12

Answer

Dieser gibt die Zeilen aus Datei2 aus, deren Name in beiden Dateien vorkommt, aber einige der Werte unterschiedlich sind

awk 'NR==FNR {f1[$1]=$0; next} $1 in f1 && $0 != f1[$1]' file1.txt file2.txt

row2  1     4     11        
row1  2     5     12

Mir ist aufgefallen, dass selbst ein Unterschied in den Leerzeichen zu falschen Ergebnissen führt. Wir können die Zeilen „normalisieren“:

awk '
    NR==FNR  {$1=$1; f1[$1]=$0; next} 
    $1 in f1 {$1=$1; if ($0 != f1[$1]) print}
' file1.txt file2.txt

row2 1 4 11
row1 2 5 12

Question 2

Es gibt viele Möglichkeiten, dies zu tun. Hier ist eine Lösung mit gawk 4.x:

$ awk '
    FNR < 2 { next }
    FNR == NR {
        for (i = 2; i <= NF; i++) {
            a[$1][i] = $i;
        }
        next;
    }
    ($1 in a) {
      for (i = 2; i <= NF; i++) {
          if (a[$1][i] == $i) {
              printf("%s->Col%d: Equal\n", $1, i-1);
          } else {
              printf("%s->Col%d: Not Equal\n", $1, i-1);
          }
       }
  }
' file1.txt file2.txt
row2->Col1: Not Equal
row2->Col2: Not Equal
row2->Col3: Not Equal
row1->Col1: Not Equal
row1->Col2: Not Equal
row1->Col3: Not Equal

Erläuterung

FNR < 2 { next }: die ersten beiden Zeilen überspringen
FNR == NR: gilt nur, wenn wir die erste Datei verarbeiten. Wir speichern jeden Spaltenwert in einem assoziativen Array amit der Form a[ROW][COLUMN].
($1 in a): Überprüfen Sie, ob die Zeile in Datei2 in Datei1 vorhanden ist. Wenn dies zutrifft, durchlaufen wir alle Spaltenwerte und vergleichen sie mit dem Wert in Datei1.

Bei älteren gawkVersionen können Sie Folgendes versuchen:

$ awk '
    FNR < 2 { next }
    FNR == NR {
        for (i = 2; i <= NF; i++) {
            a[i,$1] = $i;
            b[$1];
        }
        next;
    }
    ($1 in b) {
      for (i = 2; i <= NF; i++) {
          if (a[i,$1] == $i) {
              printf("%s->Col%d: Equal\n", $1, i-1);
          } else {
              printf("%s->Col%d: Not Equal\n", $1, i-1);
          }
       }
  }
' file1.txt file2.txt

Answer

Es gibt viele Möglichkeiten, dies zu tun. Hier ist eine Lösung mit gawk 4.x:

$ awk '
    FNR < 2 { next }
    FNR == NR {
        for (i = 2; i <= NF; i++) {
            a[$1][i] = $i;
        }
        next;
    }
    ($1 in a) {
      for (i = 2; i <= NF; i++) {
          if (a[$1][i] == $i) {
              printf("%s->Col%d: Equal\n", $1, i-1);
          } else {
              printf("%s->Col%d: Not Equal\n", $1, i-1);
          }
       }
  }
' file1.txt file2.txt
row2->Col1: Not Equal
row2->Col2: Not Equal
row2->Col3: Not Equal
row1->Col1: Not Equal
row1->Col2: Not Equal
row1->Col3: Not Equal

Erläuterung

FNR < 2 { next }: die ersten beiden Zeilen überspringen
FNR == NR: gilt nur, wenn wir die erste Datei verarbeiten. Wir speichern jeden Spaltenwert in einem assoziativen Array amit der Form a[ROW][COLUMN].
($1 in a): Überprüfen Sie, ob die Zeile in Datei2 in Datei1 vorhanden ist. Wenn dies zutrifft, durchlaufen wir alle Spaltenwerte und vergleichen sie mit dem Wert in Datei1.

Bei älteren gawkVersionen können Sie Folgendes versuchen:

$ awk '
    FNR < 2 { next }
    FNR == NR {
        for (i = 2; i <= NF; i++) {
            a[i,$1] = $i;
            b[$1];
        }
        next;
    }
    ($1 in b) {
      for (i = 2; i <= NF; i++) {
          if (a[i,$1] == $i) {
              printf("%s->Col%d: Equal\n", $1, i-1);
          } else {
              printf("%s->Col%d: Not Equal\n", $1, i-1);
          }
       }
  }
' file1.txt file2.txt

Question 3

Probieren Sie dies in der inneren For-Schleife aus:

awk ' {
      if(i == j)
           print "Same value";
      else
           print "Not the same";
       }'

Dies ist eine einfache bedingte Anweisung, die hilfreich sein könnte, aber beim Vergleichen zweier verschiedener Textdateien sind möglicherweise noch einige Anpassungen erforderlich …

Answer

Probieren Sie dies in der inneren For-Schleife aus:

awk ' {
      if(i == j)
           print "Same value";
      else
           print "Not the same";
       }'

Dies ist eine einfache bedingte Anweisung, die hilfreich sein könnte, aber beim Vergleichen zweier verschiedener Textdateien sind möglicherweise noch einige Anpassungen erforderlich …

Vergleichen von Textdateien mit Bash und AWK

Antwort1

Antwort2

Antwort3

verwandte Informationen