表現方法:
どうして?
「ページセグメンテーションモード」を「単一文字」に設定する必要があります。
たとえば、Androidでは、次のようにします。
api.setPageSegMode(TessBaseAPI.pageSegMode.PSM_SINGLE_CHAR);
Tesseractのページセグメンテーションモードを「単一文字」に設定する必要があります。
これ見たことある?
https://code.google.com/p/tesseract-ocr/issues/detail?id=581
バグリストには、「もう問題ではない」と表示されます。
init Tesseract
_の前にbaseApi.setVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz");
コードを使用しますその構成を行うためのPythonコードは次のようになります。
import pytesseract
import cv2
img = cv2.imread("path to some image")
pytesseract.image_to_string(img, config="-c tessedit"
"_char_whitelist=abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789"
" --psm 10"
" -l osd"
" "))
--psm
フラグは、ページセグメンテーションモードを定義します。
正八胞体の文書によると、10
手段 :
画像を1文字として扱います。
したがって、単一の文字を認識するために使用する必要があるのは:--psm 10
国旗。