私の目的は、Windows 7マシンでTesseractを使用してPython 2.7でOCRを使用することですが、インストールプロセスに関する問題に直面しています。指示に従って here しかし、「tesseract-core-yyyymmdd.exe」および「tesseract-langs-yyyymmdd.exe」へのリンクはもう存在せず、これらの.exeはオンラインの他の場所では見つかりませんここに私がこれまでに行ったことを示します。
ここで、Pythonで次の操作を行うと:
_from wand.image import Image from PIL import Image as PI import pyocr import pyocr.builders import io
_
これらのパッケージのロードに問題はありませんが、pyocr.get_available_tools()
は空のリストを提供します。これは上記のインストールされていない.exeファイルに関係していると思います。どこで見つけることができますか?私が行方不明になっているのは他の何かですか?
私はpytesseractをセットアップしようとしましたが、うまくいきます! Windows 10があり、python 2.7がインストールされています。
あなたがする必要があるすべて:
pythonこのリンク経由でtesseractをダウンロード https://pypi.python.org/pypi/pytesseract
ファイルを圧縮します。
Unizipファイルを含むディレクトリに移動します
このコマンド「python setup.py install」を実行します
(追加)インストールされているかどうかをテストするには、python Shellに移動してこのコマンド "import pytesseract"を実行します
うまくいくことを願っています!! pytesseractはGoogleベースのOCRであり、tesseractと同様に機能することに注意してください。
ステップ[1]インストールするにはtesseract親切にご覧ください
https://github.com/UB-Mannheim/tesseract/wiki
最新のインストーラーはここからダウンロードできます:eg、tesseract-ocr-setup-3.05.02-20180621.exe、tesseract-ocr-w32-setup-v4.0.0-beta .1.20180608.exe、tesseract-ocr-w64-setup-v4.0.0-beta.1.20180608.exe(64ビット)
ステップ[2] Python 2.7のMicrosoft Visual C++コンパイラを以下のリンクからダウンロードします https://download.Microsoft.com/download/7 /9/6/796EF2E4-801B-4FC4-AB28-B59FBF6D907B/VCForPython27.msi
ステップ[3]インストールpytesseractバインド用tesseract pipを使用
pip install pytesseract
ステップ[4]さらに、Pythonに画像処理ライブラリをインストールできます(例:pillow:
pip install pillow
挨拶!!できました!! :)
PIPはPython packagesのパッケージマネージャーです
pip search "pytesseract"
、最新バージョンを確認できますpip install pytesseract
最新バージョンの場合またはpip install pytesseract==0.3.0
必要なバージョン。import pytesseract
確実にインストールされました。 両方をインストールすれば完了です
バイナリ: https://github.com/UB-Mannheim/tesseract/wiki
ここからPythonラッパー: https://pypi.python.org/pypi/pytesseract