Печать частоты количества столбцов в строках текстового файла

Question 1

Если у вас последняя (> 4.0) версия GNU awk:

gawk '
  {a[NF]++} 
  END {
    PROCINFO["sorted_in"]="@ind_num_asc"; 
    for (i in a) printf "%d (%d)\n", a[i], i;
  }' file
4 (1)
1 (3)
3 (4)
1 (9)

Answer

Если у вас последняя (> 4.0) версия GNU awk:

gawk '
  {a[NF]++} 
  END {
    PROCINFO["sorted_in"]="@ind_num_asc"; 
    for (i in a) printf "%d (%d)\n", a[i], i;
  }' file
4 (1)
1 (3)
3 (4)
1 (9)

Question 2

таращитьсяподход (с использованием asortiфункции):

awk '{a[NF]++}END{ asorti(a,b); for(i in b) printf("%d (%d)\n",a[b[i]],b[i]) }' file

Выход:

4 (1)
1 (3)
3 (4)
1 (9)

asorti(a,b)- сортировка массива по индексам

Answer

таращитьсяподход (с использованием asortiфункции):

awk '{a[NF]++}END{ asorti(a,b); for(i in b) printf("%d (%d)\n",a[b[i]],b[i]) }' file

Выход:

4 (1)
1 (3)
3 (4)
1 (9)

asorti(a,b)- сортировка массива по индексам

Question 3

Если вы рассматриваете каждую ячейку в таблице как местозаполнитель для создания желаемого результата, то вы можете отсортировать и подсчитать повторяющиеся строки, чтобы определить, сколько строк имеют одинаковое количество столбцов.

a=$(sed 's/\([0-9]\+\)/1/g' file | sort | uniq -c)
dups=$( echo "$a" | cut -d' ' -f7 )

И после этого вы можете подсчитать количество слов в каждой строке, чтобы определить, сколько столбцов в строке.

words=$(echo "$a" | cut -d' ' -f8- | awk '{print NF}')
paste <(echo "$dups") <(echo "$words")
4       1
1       3
3       4
1       9

Answer

Если вы рассматриваете каждую ячейку в таблице как местозаполнитель для создания желаемого результата, то вы можете отсортировать и подсчитать повторяющиеся строки, чтобы определить, сколько строк имеют одинаковое количество столбцов.

a=$(sed 's/\([0-9]\+\)/1/g' file | sort | uniq -c)
dups=$( echo "$a" | cut -d' ' -f7 )

И после этого вы можете подсчитать количество слов в каждой строке, чтобы определить, сколько столбцов в строке.

words=$(echo "$a" | cut -d' ' -f8- | awk '{print NF}')
paste <(echo "$dups") <(echo "$words")
4       1
1       3
3       4
1       9

Question 4

Самый простой вариант —

cat data.txt | awk '{counts[NF] += 1} END { for (row_count in counts) { printf "%d (%d)\n", counts[row_count], row_count; }'

Он просто использует NFпеременную, которая дает количество полей в строке и обновляет соответствующее значение, связанное с ней в словаре. Затем в конце потока он просто перебирает все ключи словаря и выводит их в запрошенном формате.

Answer

Самый простой вариант —

cat data.txt | awk '{counts[NF] += 1} END { for (row_count in counts) { printf "%d (%d)\n", counts[row_count], row_count; }'

Он просто использует NFпеременную, которая дает количество полей в строке и обновляет соответствующее значение, связанное с ней в словаре. Затем в конце потока он просто перебирает все ключи словаря и выводит их в запрошенном формате.

Печать частоты количества столбцов в строках текстового файла

решение1

решение2

решение3

решение4

Связанный контент