Tesseractは単一の文字を認識しません

Question

表現方法：

ペイントで新しい画像を作成する（任意のサイズ）
この画像に文字Aを追加します
認識してみてください-> tesseractは文字を見つけられません
この文字をこの画像に5〜6回コピーして貼り付けます
認識してみてください-> tesseractはすべての文字を見つけます

どうして？

Marco Bonifazi · Accepted Answer

「ページセグメンテーションモード」を「単一文字」に設定する必要があります。

たとえば、Androidでは、次のようにします。

api.setPageSegMode(TessBaseAPI.pageSegMode.PSM_SINGLE_CHAR);

rmtheis · Answer

Tesseractのページセグメンテーションモードを「単一文字」に設定する必要があります。

TryTryAgain · Answer

これ見たことある？

https://code.google.com/p/tesseract-ocr/issues/detail?id=581

バグリストには、「もう問題ではない」と表示されます。

必ず高解像度の画像を用意してください。
画像のサイズを変更する場合は、DPIを高く保ち、サイズを小さくしすぎないようにしてください。
必ずテッセラクトシステムをトレーニングする
_init Tesseract_の前にbaseApi.setVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz");コードを使用します
また、 OCRで使用するフォントを調べることもできます。

Shahryar Saljoughi · Answer

その構成を行うためのPythonコードは次のようになります。

import pytesseract import cv2 img = cv2.imread("path to some image") pytesseract.image_to_string(img, config="-c tessedit" "_char_whitelist=abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789" " --psm 10" " -l osd" " "))

--psmフラグは、ページセグメンテーションモードを定義します。

正八胞体の文書によると、10 手段：

画像を1文字として扱います。

したがって、単一の文字を認識するために使用する必要があるのは：--psm 10 国旗。