小さなLinuxクラスター(12台のマシン)があります。データベースにデータを入力する前に(次にデータベースの内容からレポートを作成する)、いくつかのファイルのスペルチェックを行います。私が抱えている問題は、テキストファイルの一部のフィールドに、薬物やその他の医学用語のリスト、およびスペルチェッカーが自動的にスペルミスと見なすその他の頭字語が含まれることです。例:ライン
DRUGS:=ASPIRIN;BISOPROLOL;RAMIPRIL;GTN;TAMSULOSIN;PIZOTIFEN;CO-CODAMOL
コマンドを発行するとaspell --lang en_GB check filename
それはこれらの薬のほとんどを認識しませんか?
Aspellが使用できるワードリスト(つまり、受け入れられた薬と頭字語のリストを含むテキストファイル)を作成して、次のようにすることは可能ですか?(a)スペルが間違っている薬を無視する(b)薬のスペルが間違っている場合は正しいことを示唆するスペルト小麦バージョン
はい、--personal=FILE
または-p
パラメータを使用して個人の単語リストを追加できます。
aspell -p /path/to/my/wordlist check /path/to/the/file/to/check
個人の単語リストには、1行に1つの単語が必要です。
毎回オプションを入力したくない場合は、~/.aspell.conf
または/etc/aspell.conf
に追加できます。