Я загрузил пакет aspell для поддержки словаря бенгальского языка. Из tarball мне удалось выделить файл bn.wl, который представляет собой просто список из примерно 100 000 слов, по одному в каждой строке.
Проблема в том, что кодировка, по-видимому, is13194-bn, и любой текстовый редактор, которым я открываю файл, показывает мусор (одно мусорное слово на строку). Вероятно, он ожидает utf8 или что-то в этом роде.
Как мне преобразовать этот файл в читаемый вид? Я пробовал использовать iconv, но он, видимо, не распознает кодировку.
решение1
Используйте сам aspell для предоставления списка слов в удобном для чтения формате:
aspell -l bn dump master
Ключ -l указывает на определенный словарь. Если он отсутствует, то выбирается словарь по умолчанию.