
我需要捷克語單字的完整列表。我所說的全面是指至少涵蓋超過 70K 單字的清單(每行一個單字)。有沒有辦法將捷克語加入 /usr/share/dict?我在 ubuntu 軟體包安裝程式上找不到任何資源(涵蓋其他語言,但不包括捷克語),Google 也沒有幫助!
答案1
myspell 捷克語字典 (myspell-cs) 和 GNU Aspell 的捷克語字典 (aspell-cs)可以從目前所有支援的 Ubuntu 版本中的預設儲存庫進行安裝。要安裝一個或另一個捷克語字典包,請運行sudo apt install myspell-cs
或sudo apt install aspell-cs
有 166,566 個捷克語單字的列表:https://raw.githubusercontent.com/titoBouzout/Dictionaries/master/Czech.dic。此列表僅包含單詞,不包括列表中單詞的定義。
答案2
我還需要在整個捷克語字典中找到特定單詞,並使用aspell
包含 310 萬捷克語單字的內容。
$apt install aspell aspell-cs
$aspell -d cs dump master | aspell -l cs expand | wc -l
3141344
$aspell -d cs dump master | aspell -l cs expand | egrep ".{30,}" | wc -l
110
這顯示了超過 30 個字元的單字總數。您可以使用不同的 grep 模式來尋找填字遊戲中缺少的單字:-)
來源: https://superuser.com/questions/137957/how-to-convert-aspell-dictionary-to-simple-list-of-words