Объединить несколько строк в одном файле на основе столбца 1

Question 1

awk '{
      if(NR!=1){a[$1]=$2";"a[$1]}
      else print $0}
    END{
      n = asorti(a, b);
      for (n in b) {
      print b[n],a[b[n]]
      }
    }'

Answer

awk '{
      if(NR!=1){a[$1]=$2";"a[$1]}
      else print $0}
    END{
      n = asorti(a, b);
      for (n in b) {
      print b[n],a[b[n]]
      }
    }'

Question 2

Решение на Perl:

$ perl -F"\t" -anle 'if($.==1){print; next} push @{$k{$F[0]}},@F[1..$#F]; 
  END{print "$_\t" . join(";",@{$k{$_}}) for sort keys(%k)}' file 
A   B   
123 fvv;kjf;ccd
567 abc;abc
879 ttt

Это может работать с произвольным количеством полей. Однако это требует загрузки довольно большого количества вещей в память, и это может стать проблемой, если ваш файл большой.

Что касается того, где вы ошиблись, мы не сможем вам сказать, пока вы не объясните, что на самом деле произошло, но, навскидку, ваша попытка с помощью Perl потерпит неудачу, потому что:

Вы используете -F,, который устанавливает разделитель полей на запятую, когда ваши входные данные содержат символы табуляции.
Вы используете -lи print "foo\n". Он -lуже добавляет новую строку к каждому вызову print, поэтому у вас будет несколько пустых строк.
Вы используете $h{$F[0]}.", ".$F[1];для добавления, поэтому при первом запуске, когда $h{$F[0]}он не определен, вы добавите дополнительный символ ,в начало сохраненного значения.
Вы смотрите только на второе поле, игнорируя все остальные.

Аналогично, вы awkпотерпите неудачу, потому что:

Вы печатаете foo""bar, что объединит вывод без пробелов между каждым полем. Вы хотите print foo,barи вы также хотите OFS="\t"для вывода с разделителями табуляции.
Вы смотрите только на второе поле, игнорируя все остальные.

Answer

Решение на Perl:

$ perl -F"\t" -anle 'if($.==1){print; next} push @{$k{$F[0]}},@F[1..$#F]; 
  END{print "$_\t" . join(";",@{$k{$_}}) for sort keys(%k)}' file 
A   B   
123 fvv;kjf;ccd
567 abc;abc
879 ttt

Это может работать с произвольным количеством полей. Однако это требует загрузки довольно большого количества вещей в память, и это может стать проблемой, если ваш файл большой.

Что касается того, где вы ошиблись, мы не сможем вам сказать, пока вы не объясните, что на самом деле произошло, но, навскидку, ваша попытка с помощью Perl потерпит неудачу, потому что:

Вы используете -F,, который устанавливает разделитель полей на запятую, когда ваши входные данные содержат символы табуляции.
Вы используете -lи print "foo\n". Он -lуже добавляет новую строку к каждому вызову print, поэтому у вас будет несколько пустых строк.
Вы используете $h{$F[0]}.", ".$F[1];для добавления, поэтому при первом запуске, когда $h{$F[0]}он не определен, вы добавите дополнительный символ ,в начало сохраненного значения.
Вы смотрите только на второе поле, игнорируя все остальные.

Аналогично, вы awkпотерпите неудачу, потому что:

Вы печатаете foo""bar, что объединит вывод без пробелов между каждым полем. Вы хотите print foo,barи вы также хотите OFS="\t"для вывода с разделителями табуляции.
Вы смотрите только на второе поле, игнорируя все остальные.

Question 3

извините за эту однострочную фразу, но вот она —

awk 'BEGIN{FS="\t"} {for(i=2; i<=NF; i++) { if (!a[$1]) a[$1]=$1FS$i ;else a[$1]=a[$1]";"$i};if ($1 != old) b[j++] = a[old];old=$1 } END{for (i=0; i<j; i++) print b[i] }' 1

123 fvv ;kjf;ccd
567 abc;abc
879 ttt

Answer

извините за эту однострочную фразу, но вот она —

awk 'BEGIN{FS="\t"} {for(i=2; i<=NF; i++) { if (!a[$1]) a[$1]=$1FS$i ;else a[$1]=a[$1]";"$i};if ($1 != old) b[j++] = a[old];old=$1 } END{for (i=0; i<j; i++) print b[i] }' 1

123 fvv ;kjf;ccd
567 abc;abc
879 ttt

Question 4

awk '
    function p(n,A){
        s = n
        for(i=2;i<=NF;i++){
            s = s "\t" A[i]
            A[i] = $i
        }
        if(n)
            print s
    }
    NR==1{
        print
        next
    }
    $1==n{
        for(i=2;i<=NR;i++)
            A[i] = A[i] ";" $i
        next
    }
    {
        p(n,A)
        n = $1
    }
    END{
        p(n,A)
    }
    ' file

Answer

awk '
    function p(n,A){
        s = n
        for(i=2;i<=NF;i++){
            s = s "\t" A[i]
            A[i] = $i
        }
        if(n)
            print s
    }
    NR==1{
        print
        next
    }
    $1==n{
        for(i=2;i<=NR;i++)
            A[i] = A[i] ";" $i
        next
    }
    {
        p(n,A)
        n = $1
    }
    END{
        p(n,A)
    }
    ' file

Объединить несколько строк в одном файле на основе столбца 1

решение1

решение2

решение3

решение4

Связанный контент