
У меня есть следующие данные:
St1 apt1
St1 apt2
St2 apt5
St3 apt6
St3 apt7
St3 apt8
Я хотел бы объединить повторяющиеся строки и разделить поля запятыми, чтобы получилось 2 столбца, например:
St1 apt1,apt2
St2 apt5
St3 apt6,apt7,apt8
Я попробовал команду ниже, но она не сработала так, как ожидалось:
awk 'BEGIN{FS="\t"}; BEGIN{OFS="\t"}; { arr[$1] = arr[$1] $2 } END {for (i in arr) print i arr[i] }'
Результат был следующим:
St1apt1apt2
St2apt5
St3apt6apt7apt8
Любое предложение?
решение1
Всего пара изменений:
$ awk '
BEGIN{FS="\t"; OFS=FS};
{ arr[$1] = arr[$1] == ""? $2 : arr[$1] "," $2 }
END {for (i in arr) print i, arr[i] }
' data
St1 apt1,apt2
St2 apt5
St3 apt6,apt7,apt8
решение2
sed -e '
:a
$!N
s/^\(\(\S\+\)\s\+.*\)\n\2\s\+/\1,/;ta
' yourfile
Полученные результаты
St1 apt1,apt2
St2 apt5
St3 apt6,apt7,apt8