![Escribir en el archivo las palabras más comunes por contador con Linux](https://rvso.com/image/1518671/Escribir%20en%20el%20archivo%20las%20palabras%20m%C3%A1s%20comunes%20por%20contador%20con%20Linux.png)
Quiero escribir en un archivo las palabras que aparecen al menos X veces en el texto. Por ejemplo, para:
a
b
a
c
b
y X = 2 obtendría:
a
b
Respuesta1
Esto hace lo básico, aunque será bastante lento en una lista de palabras grande:
set Count
sort < WordList | uniq | while read w; \
do [ $(grep -c "^$w$" WordList) -ge $1 ] && echo $w; done
Una respuesta más rápida (gracias a Kamil Maciorowski):-
set Count
sort < WordList | uniq -c | while read c w; do [ $c -ge $1 ] && echo $w; done
Esto supone: -
- Establecerás tus propias
FileList
entradasCount
. - Las palabras están una por línea en
WordList
. - El caso es significativo (por ejemplo,
The
ythe
son diferentes). - Esta es la entrada de la línea de comandos: en un script,
set Count
se omitiría y se pasaría como parámetro.
Esto debería ayudarle a comenzar, aunque es casi seguro que necesitará modificarlo según sus necesidades específicas.