web-dev-qa-db-ja.com

Tesseractを使用した手書き認識

フォーム内のすべての小さなボックスに大文字をすべて使用すると、手書き認識でtesseractがどれほど正確かを疑問に思いました。

あなたはそれを訓練して自分の手書きをいくらか認識できることを知っていますが、私の場合の問題は、複数の手書きでそれを使用する必要があることです。誰かが私を正しい方向に向けることができますか?

どうもありがとう。

21
Jackdaw

要するに、手書きを認識するためにTesseractエンジンをトレーニングする必要があります。このリンクを見てください:

辞書トレーニングを使用したTesseract手書き

これは、リンクされた投稿の内容です:

手書きを認識するためにtesseractを訓練することは可能です。手順は次のとおりです。 http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract

しかし、非常に良い結果を期待しないでください。学者は通常、精度の結果が約90%を超えています。単語と数字の参照をいくつか示します。したがって、ユースケースで少なくとも1/10のエラーを処理できる場合は、これでうまくいく可能性があります。

また、このテーマについて書かれた優れた学術記事もあります。

Jesse In Time(iJIT)情報のためのTesseractオープンソースOCRエンジンを使用した手書きテキスト注釈の認識

20
hcham1