Umfassende Liste tschechischer Wörter in Ubuntu /usr/share/dict

Umfassende Liste tschechischer Wörter in Ubuntu /usr/share/dict

Ich brauche eine umfassende Liste tschechischer Wörter. Mit umfassend meine ich eine Liste (ein Wort pro Zeile), die mindestens 70.000 Wörter abdeckt. Gibt es eine Möglichkeit, Tschechisch zu /usr/share/dict hinzuzufügen? Ich kann im Ubuntu-Paketinstallationsprogramm keine Ressourcen finden (andere Sprachen werden abgedeckt, aber nicht Tschechisch) und Google war nicht hilfreich!

Antwort1

Tschechisches Wörterbuch für myspell (myspell-cs) und tschechisches Wörterbuch für GNU Aspell (aspell-cs) kann aus den Standard-Repositorys in allen derzeit unterstützten Ubuntu-Versionen installiert werden. Um das eine oder andere tschechische Wörterbuchpaket zu installieren, führen Sie entweder sudo apt install myspell-csoder aussudo apt install aspell-cs

Eine Liste mit 166.566 tschechischen Wörtern finden Sie unter:https://raw.githubusercontent.com/titoBouzout/Dictionaries/master/Czech.dic. Diese Liste enthält nur Wörter und nicht die Definitionen der Wörter in der Liste.

Antwort2

Ich musste auch im gesamten tschechischen Wörterbuch nach bestimmten Wörtern suchen und habe aspell3,1 Millionen tschechische Wörter verwendet.

$apt install aspell aspell-cs
$aspell -d cs dump master | aspell -l cs expand | wc -l
3141344
$aspell -d cs dump master | aspell -l cs expand | egrep ".{30,}" | wc -l
110

Dies zeigt die Gesamtzahl der Wörter mit mehr als 30 Zeichen. Sie können mit verschiedenen Grep-Mustern experimentieren, um fehlende Wörter in Kreuzworträtseln zu finden :-)

Quelle: https://superuser.com/questions/137957/wie-konvertiert-man-ein-aspell-dictionary-in-eine-einfache-liste-von-worten

verwandte Informationen