conte o número de linhas com números específicos de colunas

Question 1

Awk é perfeito para isso. Ele dividirá as linhas em espaços em branco (por padrão; altere com a -Fopção) e a variável interna NF(número de campos) terá o número de campos por linha. Então, basta percorrer o arquivo, salvando o NFpara cada linha:

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

O código acima armazena apenas o número de campos ( NF) no array associativo numscujas chaves são o número de campos e os valores são o número de vezes que esse número de colunas foi encontrado no arquivo. No final, apenas percorremos o array e imprimimos. Executar o procedimento acima em seu exemplo resulta em:

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

Uma (pequena) desvantagem dessa abordagem é que você precisará manter uma entrada para cada linha do arquivo na memória. Isso não será um problema, a menos que seu arquivo seja absolutamente gigantesco ou você tenha pouquíssima memória disponível, mas se for, você pode contornar isso apenas imprimindo o número de campos por linha e depois contando:

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

Ou, para obter a mesma saída:

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Answer

Awk é perfeito para isso. Ele dividirá as linhas em espaços em branco (por padrão; altere com a -Fopção) e a variável interna NF(número de campos) terá o número de campos por linha. Então, basta percorrer o arquivo, salvando o NFpara cada linha:

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

O código acima armazena apenas o número de campos ( NF) no array associativo numscujas chaves são o número de campos e os valores são o número de vezes que esse número de colunas foi encontrado no arquivo. No final, apenas percorremos o array e imprimimos. Executar o procedimento acima em seu exemplo resulta em:

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

Uma (pequena) desvantagem dessa abordagem é que você precisará manter uma entrada para cada linha do arquivo na memória. Isso não será um problema, a menos que seu arquivo seja absolutamente gigantesco ou você tenha pouquíssima memória disponível, mas se for, você pode contornar isso apenas imprimindo o número de campos por linha e depois contando:

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

Ou, para obter a mesma saída:

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Question 2

Uma não awksolução, talvez um pouco complicada:

$ a=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ b=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ c=$(grep '^[GHTER_0-9]\+$' file | wc -l)
$ printf "3 columns %s\n2 columns %s\n1 column %s\n" $a $b $c
3 columns 3
2 columns 14
1 columns 7

Answer

Uma não awksolução, talvez um pouco complicada:

$ a=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ b=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ c=$(grep '^[GHTER_0-9]\+$' file | wc -l)
$ printf "3 columns %s\n2 columns %s\n1 column %s\n" $a $b $c
3 columns 3
2 columns 14
1 columns 7

conte o número de linhas com números específicos de colunas

Responder1

Responder2

informação relacionada