特定の列数を持つ行の数を数える

Question 1

Awk はこれに最適です。行を空白で分割し (デフォルト。オプションで変更可能-F)、内部変数(フィールド数) に行あたりのフィールド数が格納されます。したがって、ファイルを調べて、各行のをNF保存するだけです。NF

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

上記のコードは、フィールド数 ( NF) を連想配列に格納するだけですnums。連想配列のキーはフィールド数、値はファイル内で見つかった列数の回数です。最後に、配列を調べて出力します。上記の例を実行すると、次のようになります。

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

この方法の 1 つの (小さな) 欠点は、ファイル内の各行のエントリをメモリ内に保持する必要があることです。ファイルが非常に巨大であるか、使用可能なメモリが非常に少ない場合を除いて、これは問題になりませんが、そのような場合は、行ごとにフィールドの数を出力してカウントするだけで回避できます。

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

または、同じ出力を得るには:

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Answer