サーバーにTesseract-OCRをインストールしようとしていますが、正しいリポジトリであると思われるものをすべてインストールすると、インストールしようとすると、パッケージが見つかりません
Rpmforgeを追加しようとしましたが、役に立ちませんでした。以前に行ったことがある、またはリポジトリの追加と検索に精通している誰かからのアイデアはありますか?
Centosで正しく機能するこれらの手順を使用しました
CentosのソースからTesseract OCRライブラリをインストールします
LeptonicaおよびTeseractのソースをダウンロードします。
$ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
$ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz
Libsを構成、コンパイル、インストールします。
$ tar xzvf leptonica-1.69.tar.gz
$ cd leptonica-1.69
$ ./configure
$ make
$ Sudo make install
$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-3.01
$ ./autogen.sh
$ ./configure
$ make
$ Sudo make install
$ Sudo ldconfig
言語(英語)をダウンロードし、tessdataフォルダーにコピーします。
$ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ Sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata
そしてそれを楽しんでください;)
ここでrpmからインストールしてみることをお勧めします: http://pkgs.org/download/tesseract いくつかの依存関係もあります:libpng-devel、libjpeg-devel、libtiff-devel、zlib、leptonica。最後の2つはRPMサイトでも見つけることができます
これは私のために働いた:
/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch
tesseractはepelリポジトリにはありませんが、epel-testingリポジトリにはデフォルトでアクティブ化されていません。
Centos7にTesseract3.05をインストールするためのbashスクリプトを作成しました。これにより、すべての依存関係がフェッチおよびインストールされ、英語、ヒンディー語、ベンガル語、タイ語の言語ファイルもインストールされます。
GitHubで利用可能なコード
https://github.com/EisenVault/install-tesseract-redhat-centos
お役に立てれば。
ソースからTesseract OCRライブラリをインストールします(2018年7月14日に更新)
LeptonicaおよびTeseractのソースをダウンロードします。
$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz
$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz
Leptonicaの構成、コンパイル、インストール:
$ tar xzvf leptonica-1.76.0.tar.gz
$ cd leptonica-1.76.0
$ ./configure & make & Sudo make install
Tesseractの構成、コンパイル、インストール:
$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-ocr
$ ./autogen.sh & ./configure & make & Sudo make install & Sudo ldconfig
言語ファイルのダウンロード:
ここから英語のファイル(eng.traineddata)をダウンロードしています。ここで言語ファイルの完全なリストを確認し、必要に応じてダウンロードできます。 https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-302
言語(英語)をダウンロードし、tessdataフォルダーにコピーします。
$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ Sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata
これで、Tesseract OCRがインストールされ、使用できるようになりました。例:
$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng
楽しい!!!