計算具有特定列數的行數

Question 1

awk 非常適合這個。它將在空白處分割行（預設；使用選項變更-F），並且內部變數NF（字段數）具有每行的字段數。因此，只需瀏覽該文件，保存NF每一行：

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

上面的程式碼只是將字段數 ( NF) 儲存在關聯數組中nums，該數組的鍵是字段數，值是在檔案中找到列數的次數。最後，我們只需遍歷數組並列印即可。在您的範例上運行上述結果將導致：

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

這種方法的一個（小）缺點是您需要在記憶體中為文件中的每一行保留一個條目。這不會是一個問題，除非你的文件絕對巨大或你的可用內存非常少，但如果是這樣，你可以通過打印出每行的字段數然後計數來解決這個問題：

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

或者，要獲得相同的輸出：

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Answer