Abrufen einer Liste von Wörtern aus einem GNU-Aspell-Wörterbuch

Abrufen einer Liste von Wörtern aus einem GNU-Aspell-Wörterbuch

Ich habe das Aspell-Paket für die Unterstützung des bengalischen Wörterbuchs heruntergeladen. Aus dem Tarball konnte ich die Datei bn.wl isolieren, die einfach eine Liste von etwa 100.000 Wörtern ist, eines pro Zeile.

Das Problem ist, dass die Kodierung anscheinend is13194-bn ist und jeder Texteditor, mit dem ich die Datei öffne, Müll anzeigt (ein Müllwort pro Zeile). Wahrscheinlich wird UTF8 oder so etwas erwartet.

Wie kann ich diese Datei in ein lesbares Format konvertieren? Ich habe es mit iconv versucht, aber es kann die Kodierung anscheinend nicht erkennen.

Antwort1

Verwenden Sie aspell selbst, um die Wortliste in einem lesbaren Format bereitzustellen:

aspell -l bn dump master

Der Schalter -l zielt auf ein bestimmtes Wörterbuch ab. Wenn dieser fehlt, wird das Standardwörterbuch ausgewählt.

verwandte Informationen