подсчитать количество строк с определенным количеством столбцов

Question 1

Awk идеально подходит для этого. Он разделит строки по пробелам (по умолчанию; измените с помощью параметра -F), а внутренняя переменная NF(число полей) содержит число полей в строке. Так что просто пройдитесь по файлу, сохраняя NFдля каждой строки:

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

Код выше просто сохраняет количество полей ( NF) в ассоциативном массиве nums, ключи которого — это количество полей, а значения — это количество раз, когда это количество столбцов было найдено в файле. В конце мы просто проходим по массиву и печатаем. Запуск вышеприведенного кода на вашем примере приводит к:

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

Один (небольшой) недостаток этого подхода заключается в том, что вам нужно будет хранить запись для каждой строки файла в памяти. Это не будет проблемой, если только ваш файл не совсем гигантский или у вас не очень мало доступной памяти, но если это так, вы можете обойти это, просто выведя количество полей на строку и затем подсчитав:

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

Или, чтобы получить тот же результат:

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Answer

Awk идеально подходит для этого. Он разделит строки по пробелам (по умолчанию; измените с помощью параметра -F), а внутренняя переменная NF(число полей) содержит число полей в строке. Так что просто пройдитесь по файлу, сохраняя NFдля каждой строки:

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

Код выше просто сохраняет количество полей ( NF) в ассоциативном массиве nums, ключи которого — это количество полей, а значения — это количество раз, когда это количество столбцов было найдено в файле. В конце мы просто проходим по массиву и печатаем. Запуск вышеприведенного кода на вашем примере приводит к:

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

Один (небольшой) недостаток этого подхода заключается в том, что вам нужно будет хранить запись для каждой строки файла в памяти. Это не будет проблемой, если только ваш файл не совсем гигантский или у вас не очень мало доступной памяти, но если это так, вы можете обойти это, просто выведя количество полей на строку и затем подсчитав:

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

Или, чтобы получить тот же результат:

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Question 2

Не awkрешение, возможно немного громоздкое:

$ a=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ b=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ c=$(grep '^[GHTER_0-9]\+$' file | wc -l)
$ printf "3 columns %s\n2 columns %s\n1 column %s\n" $a $b $c
3 columns 3
2 columns 14
1 columns 7

Answer

Не awkрешение, возможно немного громоздкое:

$ a=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ b=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ c=$(grep '^[GHTER_0-9]\+$' file | wc -l)
$ printf "3 columns %s\n2 columns %s\n1 column %s\n" $a $b $c
3 columns 3
2 columns 14
1 columns 7

подсчитать количество строк с определенным количеством столбцов

решение1

решение2

Связанный контент