
체코어 단어의 포괄적인 목록이 필요합니다. 포괄적이란 최소한 70,000개 이상의 단어가 포함된 목록(한 줄에 한 단어)을 의미합니다. /usr/share/dict에 체코어를 추가하는 방법이 있나요? 우분투 패키지 설치 프로그램에서 리소스를 찾을 수 없으며(다른 언어는 지원되지만 체코어는 지원되지 않음) Google은 도움이 되지 않았습니다!
답변1
myspell에 대한 체코어 사전(myspell-cs) 및 GNU Aspell용 체코어 사전(aspell-cs)은 현재 지원되는 모든 Ubuntu 버전의 기본 리포지토리에서 설치할 수 있습니다. 하나 또는 다른 체코어 사전 패키지를 설치하려면 다음 중 하나를 실행하십시오 sudo apt install myspell-cs
.sudo apt install aspell-cs
다음 사이트에 166,566개의 체코어 단어 목록이 있습니다.https://raw.githubusercontent.com/titoBouzout/Dictionaries/master/Czech.dic. 이 목록에는 단어만 포함되어 있으며 목록에 있는 단어의 정의는 포함되지 않습니다.
답변2
전체 체코어 사전에서도 특정 단어를 찾아내야 했고 aspell
310만 개의 체코어 단어가 포함된 것을 사용했습니다.
$apt install aspell aspell-cs
$aspell -d cs dump master | aspell -l cs expand | wc -l
3141344
$aspell -d cs dump master | aspell -l cs expand | egrep ".{30,}" | wc -l
110
30자 이상 긴 단어의 총 개수를 표시합니다. 다양한 grep 패턴을 사용하여 십자말풀이에서 누락된 단어를 찾을 수 있습니다 :-)
원천: https://superuser.com/questions/137957/how-to-convert-aspell-dictionary-to-simple-list-of-words