
Ich brauche eine umfassende Liste tschechischer Wörter. Mit umfassend meine ich eine Liste (ein Wort pro Zeile), die mindestens 70.000 Wörter abdeckt. Gibt es eine Möglichkeit, Tschechisch zu /usr/share/dict hinzuzufügen? Ich kann im Ubuntu-Paketinstallationsprogramm keine Ressourcen finden (andere Sprachen werden abgedeckt, aber nicht Tschechisch) und Google war nicht hilfreich!
Antwort1
Tschechisches Wörterbuch für myspell (myspell-cs) und tschechisches Wörterbuch für GNU Aspell (aspell-cs) kann aus den Standard-Repositorys in allen derzeit unterstützten Ubuntu-Versionen installiert werden. Um das eine oder andere tschechische Wörterbuchpaket zu installieren, führen Sie entweder sudo apt install myspell-cs
oder aussudo apt install aspell-cs
Eine Liste mit 166.566 tschechischen Wörtern finden Sie unter:https://raw.githubusercontent.com/titoBouzout/Dictionaries/master/Czech.dic. Diese Liste enthält nur Wörter und nicht die Definitionen der Wörter in der Liste.
Antwort2
Ich musste auch im gesamten tschechischen Wörterbuch nach bestimmten Wörtern suchen und habe aspell
3,1 Millionen tschechische Wörter verwendet.
$apt install aspell aspell-cs
$aspell -d cs dump master | aspell -l cs expand | wc -l
3141344
$aspell -d cs dump master | aspell -l cs expand | egrep ".{30,}" | wc -l
110
Dies zeigt die Gesamtzahl der Wörter mit mehr als 30 Zeichen. Sie können mit verschiedenen Grep-Mustern experimentieren, um fehlende Wörter in Kreuzworträtseln zu finden :-)