GNU aspell 사전에서 단어 목록 얻기

GNU aspell 사전에서 단어 목록 얻기

벵골어 사전 지원을 위해 aspell 패키지를 다운로드했습니다. 타르볼에서 각 줄에 하나씩 약 100,000개의 단어가 포함된 간단한 목록인 bn.wl 파일을 분리할 수 있었습니다.

문제는 인코딩이 분명히 is13194-bn이고 파일을 여는 모든 텍스트 편집기에 쓰레기(한 줄에 쓰레기 단어 하나)가 표시된다는 것입니다. 아마도 utf8 등을 기대하고 있을 것입니다.

이 파일을 읽을 수 있는 형식으로 변환하려면 어떻게 해야 합니까? iconv를 사용해 보았지만 인코딩을 인식할 수 없는 것 같습니다.

답변1

읽을 수 있는 형식으로 단어 목록을 제공하려면 aspell 자체를 사용하십시오.

aspell -l bn dump master

-l 스위치는 특정 사전을 대상으로 하며, 사전이 없으면 기본 사전이 선택됩니다.

관련 정보