Mehrere Zeilen in derselben Datei basierend auf Spalte 1 zusammenführen

Question 1

awk '{
      if(NR!=1){a[$1]=$2";"a[$1]}
      else print $0}
    END{
      n = asorti(a, b);
      for (n in b) {
      print b[n],a[b[n]]
      }
    }'

Answer

awk '{
      if(NR!=1){a[$1]=$2";"a[$1]}
      else print $0}
    END{
      n = asorti(a, b);
      for (n in b) {
      print b[n],a[b[n]]
      }
    }'

Question 2

Eine Perl-Lösung:

$ perl -F"\t" -anle 'if($.==1){print; next} push @{$k{$F[0]}},@F[1..$#F]; 
  END{print "$_\t" . join(";",@{$k{$_}}) for sort keys(%k)}' file 
A   B   
123 fvv;kjf;ccd
567 abc;abc
879 ttt

Dies kann mit einer beliebigen Anzahl von Feldern funktionieren. Allerdings müssen dazu einige Dinge in den Speicher geladen werden, was bei großen Dateien ein Problem darstellen kann.

Was Ihren Fehler angeht, können wir Ihnen das nicht sagen, sofern Sie nicht erklären, was tatsächlich passiert ist. Aber spontan fällt mir ein, dass Ihr Perl-Versuch aus folgendem Grund fehlschlagen würde:

Sie verwenden -F,, wodurch der Feldtrenner auf ein Komma gesetzt wird, wenn Ihre Eingabe Tabulatoren enthält.
Sie verwenden -lund print "foo\n". Das -lfügt bereits jedem Druckaufruf eine neue Zeile hinzu, sodass Sie mehrere leere Zeilen haben.
Sie verwenden $h{$F[0]}.", ".$F[1];zum Anhängen, sodass Sie beim ersten Ausführen, wenn es nicht definiert ist, am Anfang Ihres gespeicherten Werts $h{$F[0]}ein zusätzliches Element hinzufügen .,
Sie betrachten nur das zweite Feld und ignorieren alle anderen.

Ebenso awkwird Ihr Versuch scheitern, weil:

Sie drucken foo""bar, wodurch die Ausgabe ohne Leerzeichen zwischen den einzelnen Feldern aneinandergereiht wird. Sie möchten print foo,barund Sie möchten auch OFS="\t"eine tabulatorgetrennte Ausgabe.
Sie betrachten nur das zweite Feld und ignorieren alle anderen.

Answer

Eine Perl-Lösung:

$ perl -F"\t" -anle 'if($.==1){print; next} push @{$k{$F[0]}},@F[1..$#F]; 
  END{print "$_\t" . join(";",@{$k{$_}}) for sort keys(%k)}' file 
A   B   
123 fvv;kjf;ccd
567 abc;abc
879 ttt

Dies kann mit einer beliebigen Anzahl von Feldern funktionieren. Allerdings müssen dazu einige Dinge in den Speicher geladen werden, was bei großen Dateien ein Problem darstellen kann.

Was Ihren Fehler angeht, können wir Ihnen das nicht sagen, sofern Sie nicht erklären, was tatsächlich passiert ist. Aber spontan fällt mir ein, dass Ihr Perl-Versuch aus folgendem Grund fehlschlagen würde:

Sie verwenden -F,, wodurch der Feldtrenner auf ein Komma gesetzt wird, wenn Ihre Eingabe Tabulatoren enthält.
Sie verwenden -lund print "foo\n". Das -lfügt bereits jedem Druckaufruf eine neue Zeile hinzu, sodass Sie mehrere leere Zeilen haben.
Sie verwenden $h{$F[0]}.", ".$F[1];zum Anhängen, sodass Sie beim ersten Ausführen, wenn es nicht definiert ist, am Anfang Ihres gespeicherten Werts $h{$F[0]}ein zusätzliches Element hinzufügen .,
Sie betrachten nur das zweite Feld und ignorieren alle anderen.

Ebenso awkwird Ihr Versuch scheitern, weil:

Sie drucken foo""bar, wodurch die Ausgabe ohne Leerzeichen zwischen den einzelnen Feldern aneinandergereiht wird. Sie möchten print foo,barund Sie möchten auch OFS="\t"eine tabulatorgetrennte Ausgabe.
Sie betrachten nur das zweite Feld und ignorieren alle anderen.

Question 3

entschuldigen Sie diesen Einzeiler, aber hier ist er -

awk 'BEGIN{FS="\t"} {for(i=2; i<=NF; i++) { if (!a[$1]) a[$1]=$1FS$i ;else a[$1]=a[$1]";"$i};if ($1 != old) b[j++] = a[old];old=$1 } END{for (i=0; i<j; i++) print b[i] }' 1

123 fvv ;kjf;ccd
567 abc;abc
879 ttt

Answer

entschuldigen Sie diesen Einzeiler, aber hier ist er -

awk 'BEGIN{FS="\t"} {for(i=2; i<=NF; i++) { if (!a[$1]) a[$1]=$1FS$i ;else a[$1]=a[$1]";"$i};if ($1 != old) b[j++] = a[old];old=$1 } END{for (i=0; i<j; i++) print b[i] }' 1

123 fvv ;kjf;ccd
567 abc;abc
879 ttt

Question 4

awk '
    function p(n,A){
        s = n
        for(i=2;i<=NF;i++){
            s = s "\t" A[i]
            A[i] = $i
        }
        if(n)
            print s
    }
    NR==1{
        print
        next
    }
    $1==n{
        for(i=2;i<=NR;i++)
            A[i] = A[i] ";" $i
        next
    }
    {
        p(n,A)
        n = $1
    }
    END{
        p(n,A)
    }
    ' file

Answer

awk '
    function p(n,A){
        s = n
        for(i=2;i<=NF;i++){
            s = s "\t" A[i]
            A[i] = $i
        }
        if(n)
            print s
    }
    NR==1{
        print
        next
    }
    $1==n{
        for(i=2;i<=NR;i++)
            A[i] = A[i] ";" $i
        next
    }
    {
        p(n,A)
        n = $1
    }
    END{
        p(n,A)
    }
    ' file

Mehrere Zeilen in derselben Datei basierend auf Spalte 1 zusammenführen

Antwort1

Antwort2

Antwort3

Antwort4

verwandte Informationen