web-dev-qa-db-ja.com

TesseractとTesseractの違いは何ですか?

Windows 10でPython 3.6を使用していて、Pytesseractが既にインストールされていますが、インストールできない code Tesserocrが見つかりました。差?

5
Soufiane Sabiri

Pytesseract は、tesseractバイナリのpython "ラッパー"です。フラグを指定するとともに、次の関数のみを提供します( man page ) :

  • get_tesseract_versionシステムにインストールされているTesseractのバージョンを返します。
  • image_to_string Tesseract OCRの実行結果を文字列に返します
  • image_to_boxes認識された文字とそのボックス境界を含む結果を返します
  • image_to_dataボックスの境界、信頼度、およびその他の情報を含む結果を返します。 Tesseract 3.05+が必要です。詳細については、Tesseract TSVのドキュメントを確認してください
  • image_to_osd方向とスクリプト検出に関する情報を含む結果を返します。

詳細は プロジェクトの説明 を参照してください。

一方、 tesserocr は、TesseractのC++ API( APIExample )と直接インターフェイスします。これは、より柔軟で複雑であり、高度な機能を提供します。

2
qwr