Windows 10でPython 3.6を使用していて、Pytesseractが既にインストールされていますが、インストールできない code Tesserocrが見つかりました。差?
Pytesseract は、tesseractバイナリのpython "ラッパー"です。フラグを指定するとともに、次の関数のみを提供します( man page ) :
get_tesseract_version
システムにインストールされているTesseractのバージョンを返します。image_to_string
Tesseract OCRの実行結果を文字列に返しますimage_to_boxes
認識された文字とそのボックス境界を含む結果を返しますimage_to_data
ボックスの境界、信頼度、およびその他の情報を含む結果を返します。 Tesseract 3.05+が必要です。詳細については、Tesseract TSVのドキュメントを確認してくださいimage_to_osd
方向とスクリプト検出に関する情報を含む結果を返します。詳細は プロジェクトの説明 を参照してください。
一方、 tesserocr は、TesseractのC++ API( APIExample )と直接インターフェイスします。これは、より柔軟で複雑であり、高度な機能を提供します。