Fusionar varias líneas en el mismo archivo según la columna 1

Question 1

awk '{
      if(NR!=1){a[$1]=$2";"a[$1]}
      else print $0}
    END{
      n = asorti(a, b);
      for (n in b) {
      print b[n],a[b[n]]
      }
    }'

Answer

awk '{
      if(NR!=1){a[$1]=$2";"a[$1]}
      else print $0}
    END{
      n = asorti(a, b);
      for (n in b) {
      print b[n],a[b[n]]
      }
    }'

Question 2

Una solución Perl:

$ perl -F"\t" -anle 'if($.==1){print; next} push @{$k{$F[0]}},@F[1..$#F]; 
  END{print "$_\t" . join(";",@{$k{$_}}) for sort keys(%k)}' file 
A   B   
123 fvv;kjf;ccd
567 abc;abc
879 ttt

Esto puede funcionar en un número arbitrario de campos. Sin embargo, requiere cargar bastantes cosas en la memoria y eso podría ser un problema si el archivo es grande.

En cuanto a dónde salió mal, no podemos decírselo a menos que explique lo que realmente sucedió, pero, en lo que se me ocurre, su intento de Perl fallaría porque:

Está utilizando -F,el cual establece el separador de campo en una coma cuando su entrada tiene pestañas.
Estás usando -ly print "foo\n". Ya -lagrega una nueva línea a cada llamada de impresión, por lo que tendrá varias líneas en blanco.
Está utilizando $h{$F[0]}.", ".$F[1];para agregar, por lo que la primera vez que se ejecuta y $h{$F[0]}no está definido, agregará un extra ,al comienzo de su valor almacenado.
Sólo estás mirando el segundo campo, ignorando todos los demás.

De manera similar, su testamento awkfallará porque:

Está imprimiendo foo""bar, lo que concatenará la salida sin espacios entre cada campo. Quiere print foo,bary también quiere OFS="\t"una salida separada por tabulaciones.
Sólo estás mirando el segundo campo, ignorando todos los demás.

Answer

Una solución Perl:

$ perl -F"\t" -anle 'if($.==1){print; next} push @{$k{$F[0]}},@F[1..$#F]; 
  END{print "$_\t" . join(";",@{$k{$_}}) for sort keys(%k)}' file 
A   B   
123 fvv;kjf;ccd
567 abc;abc
879 ttt

Esto puede funcionar en un número arbitrario de campos. Sin embargo, requiere cargar bastantes cosas en la memoria y eso podría ser un problema si el archivo es grande.

En cuanto a dónde salió mal, no podemos decírselo a menos que explique lo que realmente sucedió, pero, en lo que se me ocurre, su intento de Perl fallaría porque:

Está utilizando -F,el cual establece el separador de campo en una coma cuando su entrada tiene pestañas.
Estás usando -ly print "foo\n". Ya -lagrega una nueva línea a cada llamada de impresión, por lo que tendrá varias líneas en blanco.
Está utilizando $h{$F[0]}.", ".$F[1];para agregar, por lo que la primera vez que se ejecuta y $h{$F[0]}no está definido, agregará un extra ,al comienzo de su valor almacenado.
Sólo estás mirando el segundo campo, ignorando todos los demás.

De manera similar, su testamento awkfallará porque:

Está imprimiendo foo""bar, lo que concatenará la salida sin espacios entre cada campo. Quiere print foo,bary también quiere OFS="\t"una salida separada por tabulaciones.
Sólo estás mirando el segundo campo, ignorando todos los demás.

Question 3

Disculpas por esta frase, pero aquí va:

awk 'BEGIN{FS="\t"} {for(i=2; i<=NF; i++) { if (!a[$1]) a[$1]=$1FS$i ;else a[$1]=a[$1]";"$i};if ($1 != old) b[j++] = a[old];old=$1 } END{for (i=0; i<j; i++) print b[i] }' 1

123 fvv ;kjf;ccd
567 abc;abc
879 ttt

Answer

Disculpas por esta frase, pero aquí va:

awk 'BEGIN{FS="\t"} {for(i=2; i<=NF; i++) { if (!a[$1]) a[$1]=$1FS$i ;else a[$1]=a[$1]";"$i};if ($1 != old) b[j++] = a[old];old=$1 } END{for (i=0; i<j; i++) print b[i] }' 1

123 fvv ;kjf;ccd
567 abc;abc
879 ttt

Question 4

awk '
    function p(n,A){
        s = n
        for(i=2;i<=NF;i++){
            s = s "\t" A[i]
            A[i] = $i
        }
        if(n)
            print s
    }
    NR==1{
        print
        next
    }
    $1==n{
        for(i=2;i<=NR;i++)
            A[i] = A[i] ";" $i
        next
    }
    {
        p(n,A)
        n = $1
    }
    END{
        p(n,A)
    }
    ' file

Answer

awk '
    function p(n,A){
        s = n
        for(i=2;i<=NF;i++){
            s = s "\t" A[i]
            A[i] = $i
        }
        if(n)
            print s
    }
    NR==1{
        print
        next
    }
    $1==n{
        for(i=2;i<=NR;i++)
            A[i] = A[i] ";" $i
        next
    }
    {
        p(n,A)
        n = $1
    }
    END{
        p(n,A)
    }
    ' file

Fusionar varias líneas en el mismo archivo según la columna 1

Respuesta1

Respuesta2

Respuesta3

Respuesta4

información relacionada