contar el número de filas con un número específico de columnas

Question 1

Awk es perfecto para esto. Dividirá líneas en espacios en blanco (de forma predeterminada; cambie con la -Fopción) y la variable interna NF(número de campos) tiene el número de campos por línea. Entonces, simplemente revise el archivo y guarde el archivo NFpara cada línea:

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

El código anterior simplemente almacena la cantidad de campos ( NF) en la matriz asociativa numscuyas claves son la cantidad de campos y los valores son la cantidad de veces que se encontró esa cantidad de columnas en el archivo. Al final, simplemente revisamos la matriz e imprimimos. Ejecutar lo anterior en su ejemplo da como resultado:

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

Un (pequeño) inconveniente de este enfoque es que necesitará mantener una entrada para cada línea del archivo en la memoria. Eso no será un problema a menos que su archivo sea absolutamente gigantesco o tenga muy poca memoria disponible, pero si lo es, puede solucionarlo simplemente imprimiendo el número de campos por línea y luego contando:

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

O, para obtener el mismo resultado:

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Answer

Awk es perfecto para esto. Dividirá líneas en espacios en blanco (de forma predeterminada; cambie con la -Fopción) y la variable interna NF(número de campos) tiene el número de campos por línea. Entonces, simplemente revise el archivo y guarde el archivo NFpara cada línea:

awk '{ 
        nums[NF]++
     }
     END{
        for(num in nums){
            printf "%d columns: %d\n", num, nums[num]
        }
     }' file

El código anterior simplemente almacena la cantidad de campos ( NF) en la matriz asociativa numscuyas claves son la cantidad de campos y los valores son la cantidad de veces que se encontró esa cantidad de columnas en el archivo. Al final, simplemente revisamos la matriz e imprimimos. Ejecutar lo anterior en su ejemplo da como resultado:

$ awk '{ nums[NF]++}END{for(num in nums){printf "%d columns: %d\n", num, nums[num]}}' file
1 columns: 7
2 columns: 14
3 columns: 3

Un (pequeño) inconveniente de este enfoque es que necesitará mantener una entrada para cada línea del archivo en la memoria. Eso no será un problema a menos que su archivo sea absolutamente gigantesco o tenga muy poca memoria disponible, pero si lo es, puede solucionarlo simplemente imprimiendo el número de campos por línea y luego contando:

$ awk '{ print NF}' file | sort | uniq -c
      7 1
     14 2
      3 3

O, para obtener el mismo resultado:

$ awk '{ print NF}' file | sort | uniq -c | while read num fields; do printf "%d columns: %d\n" "$num" "$fields"; done
7 columns: 1
14 columns: 2
3 columns: 3

Question 2

Una no awksolución, tal vez un poco engorrosa:

$ a=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ b=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ c=$(grep '^[GHTER_0-9]\+$' file | wc -l)
$ printf "3 columns %s\n2 columns %s\n1 column %s\n" $a $b $c
3 columns 3
2 columns 14
1 columns 7

Answer

Una no awksolución, tal vez un poco engorrosa:

$ a=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ b=$(grep '^[GHTER_0-9]\+[[:space:]]\+[GHTER_0-9]\+$' file | wc -l)
$ c=$(grep '^[GHTER_0-9]\+$' file | wc -l)
$ printf "3 columns %s\n2 columns %s\n1 column %s\n" $a $b $c
3 columns 3
2 columns 14
1 columns 7

contar el número de filas con un número específico de columnas

Respuesta1

Respuesta2

información relacionada