Obtenga el recuento de apariciones de cada palabra en el documento.

Question 1

Prueba esto:

grep -o '\w*' doc.txt | sort | uniq -c | sort -nr

-oImprima cada coincidencia en lugar de líneas coincidentes
\w*Emparejar caracteres de palabras
sortclasifique las coincidencias antes de enviarlas a uniq.
uniq -cimprimir las líneas únicas y el número de apariciones-c
sort -nrOrdenación inversa por número de ocurrencias.

Producción:

  2 word
  1 third
  1 second
  1 really

Alternativa:

Utilice awkpara la salida exacta:

$ grep -o '\w*' doc.txt \
| awk '{seen[$0]++} END{for(s in seen){print s,seen[s]}}' \
| sort -k2r

word 2
really 1
second 1
third 1

Answer

Prueba esto:

grep -o '\w*' doc.txt | sort | uniq -c | sort -nr

-oImprima cada coincidencia en lugar de líneas coincidentes
\w*Emparejar caracteres de palabras
sortclasifique las coincidencias antes de enviarlas a uniq.
uniq -cimprimir las líneas únicas y el número de apariciones-c
sort -nrOrdenación inversa por número de ocurrencias.

Producción:

  2 word
  1 third
  1 second
  1 really

Alternativa:

Utilice awkpara la salida exacta:

$ grep -o '\w*' doc.txt \
| awk '{seen[$0]++} END{for(s in seen){print s,seen[s]}}' \
| sort -k2r

word 2
really 1
second 1
third 1

Question 2

perl -lnE '
  $count{$_}++ for /[[:alpha:]]+/g;
  END {
    say "@$_" for
      sort {$b->[1] <=> $a->[1] || $a->[0] cmp $b->[0]}
      map {[$_, $count{$_}]}
      keys %count
  }
' doc.txt

Esto consumirá mucha más memoria que la solución inicial de pLumo.

Answer

perl -lnE '
  $count{$_}++ for /[[:alpha:]]+/g;
  END {
    say "@$_" for
      sort {$b->[1] <=> $a->[1] || $a->[0] cmp $b->[0]}
      map {[$_, $count{$_}]}
      keys %count
  }
' doc.txt

Esto consumirá mucha más memoria que la solución inicial de pLumo.

Obtenga el recuento de apariciones de cada palabra en el documento.

Respuesta1

Respuesta2

información relacionada