根據第 1 列合併同一文件中的多行

Question 1

awk '{
      if(NR!=1){a[$1]=$2";"a[$1]}
      else print $0}
    END{
      n = asorti(a, b);
      for (n in b) {
      print b[n],a[b[n]]
      }
    }'

Answer

awk '{
      if(NR!=1){a[$1]=$2";"a[$1]}
      else print $0}
    END{
      n = asorti(a, b);
      for (n in b) {
      print b[n],a[b[n]]
      }
    }'

Question 2

Perl 解決方案：

$ perl -F"\t" -anle 'if($.==1){print; next} push @{$k{$F[0]}},@F[1..$#F]; 
  END{print "$_\t" . join(";",@{$k{$_}}) for sort keys(%k)}' file 
A   B   
123 fvv;kjf;ccd
567 abc;abc
879 ttt

這可以適用於任意數量的欄位。但是，它確實需要將相當多的內容載入到記憶體中，如果您的檔案很大，這可能會成為問題。

至於你哪裡出錯了，我們無法告訴你，除非你解釋實際發生了什麼，但是，在我的腦海中，你的 perl 嘗試會失敗，因為：

當您的輸入有製表符時，您正在使用-F,它將欄位分隔符號設為逗號。
您正在使用-l和print "foo\n"。已經-l為每個列印呼叫添加了一個換行符，因此您將有多個空白行。
您正在使用$h{$F[0]}.", ".$F[1];附加，因此第一次執行且未$h{$F[0]}定義時，您將,在儲存值的開頭新增額外的值。
您只查看第二個字段，忽略所有其他字段。

同樣，你的意志awk也會失敗，因為：

您正在列印foo""bar，這將連接輸出，每個欄位之間沒有空格。您想要print foo,bar並且也想要OFS="\t"製表符分隔的輸出。
您只查看第二個字段，忽略所有其他字段。

Answer

Perl 解決方案：

$ perl -F"\t" -anle 'if($.==1){print; next} push @{$k{$F[0]}},@F[1..$#F]; 
  END{print "$_\t" . join(";",@{$k{$_}}) for sort keys(%k)}' file 
A   B   
123 fvv;kjf;ccd
567 abc;abc
879 ttt

這可以適用於任意數量的欄位。但是，它確實需要將相當多的內容載入到記憶體中，如果您的檔案很大，這可能會成為問題。

至於你哪裡出錯了，我們無法告訴你，除非你解釋實際發生了什麼，但是，在我的腦海中，你的 perl 嘗試會失敗，因為：

當您的輸入有製表符時，您正在使用-F,它將欄位分隔符號設為逗號。
您正在使用-l和print "foo\n"。已經-l為每個列印呼叫添加了一個換行符，因此您將有多個空白行。
您正在使用$h{$F[0]}.", ".$F[1];附加，因此第一次執行且未$h{$F[0]}定義時，您將,在儲存值的開頭新增額外的值。
您只查看第二個字段，忽略所有其他字段。

同樣，你的意志awk也會失敗，因為：

您正在列印foo""bar，這將連接輸出，每個欄位之間沒有空格。您想要print foo,bar並且也想要OFS="\t"製表符分隔的輸出。
您只查看第二個字段，忽略所有其他字段。

Question 3

為這一句抱歉，但事情是這樣的——

awk 'BEGIN{FS="\t"} {for(i=2; i<=NF; i++) { if (!a[$1]) a[$1]=$1FS$i ;else a[$1]=a[$1]";"$i};if ($1 != old) b[j++] = a[old];old=$1 } END{for (i=0; i<j; i++) print b[i] }' 1

123 fvv ;kjf;ccd
567 abc;abc
879 ttt

Answer

為這一句抱歉，但事情是這樣的——

awk 'BEGIN{FS="\t"} {for(i=2; i<=NF; i++) { if (!a[$1]) a[$1]=$1FS$i ;else a[$1]=a[$1]";"$i};if ($1 != old) b[j++] = a[old];old=$1 } END{for (i=0; i<j; i++) print b[i] }' 1

123 fvv ;kjf;ccd
567 abc;abc
879 ttt

Question 4

awk '
    function p(n,A){
        s = n
        for(i=2;i<=NF;i++){
            s = s "\t" A[i]
            A[i] = $i
        }
        if(n)
            print s
    }
    NR==1{
        print
        next
    }
    $1==n{
        for(i=2;i<=NR;i++)
            A[i] = A[i] ";" $i
        next
    }
    {
        p(n,A)
        n = $1
    }
    END{
        p(n,A)
    }
    ' file

Answer

awk '
    function p(n,A){
        s = n
        for(i=2;i<=NF;i++){
            s = s "\t" A[i]
            A[i] = $i
        }
        if(n)
            print s
    }
    NR==1{
        print
        next
    }
    $1==n{
        for(i=2;i<=NR;i++)
            A[i] = A[i] ";" $i
        next
    }
    {
        p(n,A)
        n = $1
    }
    END{
        p(n,A)
    }
    ' file

根據第 1 列合併同一文件中的多行

答案1

答案2

答案3

答案4

相關內容