Imprimir la frecuencia del número de columnas en filas en un archivo de texto

Question 1

Si tiene una versión reciente (> 4.0) de GNU awk:

gawk '
  {a[NF]++} 
  END {
    PROCINFO["sorted_in"]="@ind_num_asc"; 
    for (i in a) printf "%d (%d)\n", a[i], i;
  }' file
4 (1)
1 (3)
3 (4)
1 (9)

Answer

Si tiene una versión reciente (> 4.0) de GNU awk:

gawk '
  {a[NF]++} 
  END {
    PROCINFO["sorted_in"]="@ind_num_asc"; 
    for (i in a) printf "%d (%d)\n", a[i], i;
  }' file
4 (1)
1 (3)
3 (4)
1 (9)

Question 2

papar moscasenfoque (usando asortila función):

awk '{a[NF]++}END{ asorti(a,b); for(i in b) printf("%d (%d)\n",a[b[i]],b[i]) }' file

La salida:

4 (1)
1 (3)
3 (4)
1 (9)

asorti(a,b)- ordenar una matriz por índices

Answer

papar moscasenfoque (usando asortila función):

awk '{a[NF]++}END{ asorti(a,b); for(i in b) printf("%d (%d)\n",a[b[i]],b[i]) }' file

La salida:

4 (1)
1 (3)
3 (4)
1 (9)

asorti(a,b)- ordenar una matriz por índices

Question 3

Si trata cada celda de su tabla como un marcador de posición para crear el resultado deseado, puede ordenar y contar líneas duplicadas para identificar cuántas líneas tienen la misma cantidad de columnas.

a=$(sed 's/\([0-9]\+\)/1/g' file | sort | uniq -c)
dups=$( echo "$a" | cut -d' ' -f7 )

Y después de eso puedes contar las palabras de cada línea para identificar cuántas columnas hay en la fila.

words=$(echo "$a" | cut -d' ' -f8- | awk '{print NF}')
paste <(echo "$dups") <(echo "$words")
4       1
1       3
3       4
1       9

Answer

Si trata cada celda de su tabla como un marcador de posición para crear el resultado deseado, puede ordenar y contar líneas duplicadas para identificar cuántas líneas tienen la misma cantidad de columnas.

a=$(sed 's/\([0-9]\+\)/1/g' file | sort | uniq -c)
dups=$( echo "$a" | cut -d' ' -f7 )

Y después de eso puedes contar las palabras de cada línea para identificar cuántas columnas hay en la fila.

words=$(echo "$a" | cut -d' ' -f8- | awk '{print NF}')
paste <(echo "$dups") <(echo "$words")
4       1
1       3
3       4
1       9

Question 4

La versión más simple es

cat data.txt | awk '{counts[NF] += 1} END { for (row_count in counts) { printf "%d (%d)\n", counts[row_count], row_count; }'

Simplemente utiliza NFuna variable que proporciona el número de campos en la línea y actualiza el valor relevante asociado a ella en el diccionario. Luego, al final de la secuencia, simplemente itera sobre todas las claves del diccionario y las imprime en el formato solicitado.

Answer

La versión más simple es

cat data.txt | awk '{counts[NF] += 1} END { for (row_count in counts) { printf "%d (%d)\n", counts[row_count], row_count; }'

Simplemente utiliza NFuna variable que proporciona el número de campos en la línea y actualiza el valor relevante asociado a ella en el diccionario. Luego, al final de la secuencia, simplemente itera sobre todas las claves del diccionario y las imprime en el formato solicitado.

Imprimir la frecuencia del número de columnas en filas en un archivo de texto

Respuesta1

Respuesta2

Respuesta3

Respuesta4

información relacionada