Cómo fusionar líneas duplicadas en una línea separada por coma

Cómo fusionar líneas duplicadas en una línea separada por coma

Tengo los siguientes datos:

St1 apt1
St1 apt2
St2 apt5
St3 apt6
St3 apt7
St3 apt8

Me gustaría fusionar las líneas duplicadas y separar los campos por coma y tener 2 columnas, por ejemplo:

St1 apt1,apt2
St2 apt5
St3 apt6,apt7,apt8

Probé el siguiente comando, pero no funcionó como se esperaba:

awk 'BEGIN{FS="\t"}; BEGIN{OFS="\t"}; { arr[$1] = arr[$1] $2 }   END {for (i in arr) print i arr[i] }'

El resultado fue:

St1apt1apt2
St2apt5
St3apt6apt7apt8

¿Cualquier sugerencia?

Respuesta1

Sólo un par de ajustes:

$ awk '
    BEGIN{FS="\t"; OFS=FS}; 
    { arr[$1] = arr[$1] == ""? $2 : arr[$1] "," $2 }   
    END {for (i in arr) print i, arr[i] }
' data
St1    apt1,apt2
St2    apt5
St3    apt6,apt7,apt8

Respuesta2

sed -e '
   :a
   $!N
   s/^\(\(\S\+\)\s\+.*\)\n\2\s\+/\1,/;ta
' yourfile

Resultados

St1 apt1,apt2
St2 apt5
St3 apt6,apt7,apt8

información relacionada