最近、tesseractOCRをpythonで使用しましたが、tesseractからimage_to_string
をインポートしようとするとエラーが発生し続けました。
問題の原因となるコード:
# Perform OCR using tesseract-ocr library
from tesseract import image_to_string
image = Image.open('input-NEAREST.tif')
print image_to_string(image)
上記のコードが原因のエラー:
Traceback (most recent call last):
file "./captcha.py", line 52, in <module>
from tesseract import image_to_string
ImportError: cannot import name image_to_string
Tesseractモジュールがインストールされていることを確認しました。
digital_alchemy@roaming-gnome /home $ pydoc modules | grep 'tesseract'
Hdf5StubImagePlugin _tesseract gzip sipconfig
ORBit cairo mako tesseract
必要なパッケージをすべて手に入れたと思いますが、残念ながらこの時点で行き詰まっています。関数がモジュールにないようです。
どんな助けでも大歓迎です。
私にとってうまくいったと思われるもう1つの可能性は、PILインポートイメージからイメージをインポートする代わりに、pytesseractを変更することです。
Pytesseractを変更した後にPyCharmで機能するコード:
from pytesseract import image_to_string
from PIL import Image
im = Image.open(r'C:\Users\<user>\Downloads\dashboard-test.jpeg')
print(im)
print(image_to_string(im))
PyCharmに組み込まれたパッケージ管理を介してインストールしたPytesseract
インストールしたモジュールの構文は正しいですか?それ image_to_string
関数は、このページの使用例によるとPyTesserからのもののように見えます: https://code.google.com/p/pytesser/
インポートは、より複雑な使用例がリストされているpython-tesseract用のように見えます: https://code.google.com/p/python-tesseract/
以下の手順に従ったウィンドウの場合
pip3 install pytesseract
pip3 install pillow
Tessaract-ocrのインストールも必要です https://github.com/tesseract-ocr/tesseract/wiki そうしないと、エラーが発生しますTessractはパス上にありません
Pythonコード
from PIL import Image
from pytesseract import image_to_string
print ( image_to_string(Image.open('test.tif'),lang='eng') )
私のために働くもの:
pytesseractフォームをインストールした後 tesseract-ocr-setup-3.05.02-20180621.exe 行pytesseract.pytesseract.tesseract_cmd="C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe"
を追加し、上記のコードフォームを使用します。これがすべてのコードです。
import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd="C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe"
im=Image.open("C:\\Users\\<user>\\Desktop\\ro\\capt.png")
print(pytesseract.image_to_string(im,lang='eng'))
PyCharm Community Edition 2018.2.3x64でWindows10を使用しています