テキストファイルに改行で区切られた単語の辞書があります。そして、Tesseractを使用して手書きを認識し、テキストファイルに最も近い一致する行を出力したいと思います。
Tesseractを使用するのはこれが初めてで、すでにプロジェクトワークスペースにあるので、トレーニングデータが必要です。
これを行うようにTesseractをトレーニングすることは可能ですか?
手書きを認識するようにtesseractをトレーニングすることが可能です。手順は次のとおりです。 https://tesseract-ocr.github.io/tessdoc/Training-Tesseract
しかし、非常に良い結果を期待しないでください。学者は通常、約90%を超える精度の結果を得ています。 words と numbers のいくつかのリファレンスを次に示します。したがって、ユースケースで少なくとも1/10のエラーを処理できる場合は、これでうまくいく可能性があります。