ベンガル語辞書サポート用のaspellパッケージをダウンロードしました。 tarballから、bn.wlファイルを分離することができました。これは、各行に1つずつ、約100,000語のリストです。
問題は、エンコーディングが明らかに13194-bnであり、ファイルを開いたテキストエディタにガベージ(1行に1つのガベージ-Word)が表示されることです。おそらくutf8か何かを期待しています。
このファイルを読み取り可能な形式に変換するにはどうすればよいですか? iconvを使ってみましたが、どうやらエンコーディングを認識できません。
Aspell自体を使用して、Wordリストを読み取り可能な形式で提供します。
aspell -l bn dump master
-lスイッチは特定の辞書を対象とし、それがない場合はデフォルトの辞書が選択されます。