從 GNU aspell 字典取得單字清單

從 GNU aspell 字典取得單字清單

我下載了 aspell 套件來支援孟加拉語字典。從 tarball 中,我能夠分離出 bn.wl 文件,它只是一個大約 100,000 個單字的列表,每行一個。

問題是編碼顯然是 is13194-bn,並且我打開該文件的任何文字編輯器都顯示垃圾(每行一個垃圾字)。它可能期待 utf8 或其他東西。

如何將此文件轉換為可讀形式?我嘗試使用 iconv 但它顯然無法識別編碼。

答案1

使用 aspell 本身以可讀格式提供單字清單:

aspell -l bn dump master

-l 開關針對特定字典,如果不存在,則選擇預設字典。

相關內容