Получение списка слов из словаря GNU aspell

Получение списка слов из словаря GNU aspell

Я загрузил пакет aspell для поддержки словаря бенгальского языка. Из tarball мне удалось выделить файл bn.wl, который представляет собой просто список из примерно 100 000 слов, по одному в каждой строке.

Проблема в том, что кодировка, по-видимому, is13194-bn, и любой текстовый редактор, которым я открываю файл, показывает мусор (одно мусорное слово на строку). Вероятно, он ожидает utf8 или что-то в этом роде.

Как мне преобразовать этот файл в читаемый вид? Я пробовал использовать iconv, но он, видимо, не распознает кодировку.

решение1

Используйте сам aspell для предоставления списка слов в удобном для чтения формате:

aspell -l bn dump master

Ключ -l указывает на определенный словарь. Если он отсутствует, то выбирается словарь по умолчанию.

Связанный контент