私はたくさんの画像を持っていますが、私がしたいのは、それらの画像をスキャンして、後で編集できるMS Wordファイルに出力することです。 Windowsの場合、Abbyyの素晴らしいリーダーがあります。しかし、Windowsに戻りたくありません。私のために同じことができるアプリケーションがあれば教えてください。これで私を助けてください。
まず第一に、SDKがあり、Linuxで使用できるAbbyy以外のいくつかのOCRツールがあります。ただし、すべてがMS Word出力をサポートしているわけではないことに注意してください。
これは、精度と速度に関する最初の3つのエンジンのベンチマークに関する記事(2007年からですが、おそらく関連性があります)です。 http://www.mathstat.dal.ca/~selinger/ocr-test/
ちなみに、Abbyyを含むすべてのエンジンは、非構造化テキスト、つまり、規則的な構造に従わない画像に最適です。処理している「画像」が標準レイアウトを持っている場合、例えば顧客(フィールドが常に同じ場所にある)、さまざまなカード(名刺、IDカードなど)などによって記入されたフォームには、特定のテキストフィールドのみを検出してOCRできる特別なソリューションがあります。画像「ノイズ」を出力し、構造化された方法でテキストを出力します(たとえば、名前=ジョンスミス、ID番号= 123456)。
画像が「テンプレート」であり、構造化テキストを出力できるOCRが必要な場合、実際にはごく少数のLinuxソリューションしかありません(私が知る限り)。私がよく知っている2つのソリューションを次に示します。
HTH、ダナ