CentOS6へのTesseract-OCRのインストール

Question

サーバーにTesseract-OCRをインストールしようとしていますが、正しいリポジトリであると思われるものをすべてインストールすると、インストールしようとすると、パッケージが見つかりません

Rpmforgeを追加しようとしましたが、役に立ちませんでした。以前に行ったことがある、またはリポジトリの追加と検索に精通している誰かからのアイデアはありますか？

Yusef Mohamadi · Accepted Answer

Centosで正しく機能するこれらの手順を使用しました

CentosのソースからTesseract OCRライブラリをインストールします

LeptonicaおよびTeseractのソースをダウンロードします。

$ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz $ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

Libsを構成、コンパイル、インストールします。

 $ tar xzvf leptonica-1.69.tar.gz $ cd leptonica-1.69 $ ./configure $ make $ Sudo make install $ tar xzf tesseract-ocr-3.02.02.tar.gz $ cd tesseract-3.01 $ ./autogen.sh $ ./configure $ make $ Sudo make install $ Sudo ldconfig

言語（英語）をダウンロードし、tessdataフォルダーにコピーします。

$ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz $ tar xzf tesseract-ocr-3.02.eng.tar.gz $ Sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

そしてそれを楽しんでください;）

user3133914 · Answer

ここでrpmからインストールしてみることをお勧めします： http://pkgs.org/download/tesseract いくつかの依存関係もあります：libpng-devel、libjpeg-devel、libtiff-devel、zlib、leptonica。最後の2つはRPMサイトでも見つけることができます

Little Gecko · Answer

これは私のために働いた：

/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch

tesseractはepelリポジトリにはありませんが、epel-testingリポジトリにはデフォルトでアクティブ化されていません。

Vipul Swarup · Answer

Centos7にTesseract3.05をインストールするためのbashスクリプトを作成しました。これにより、すべての依存関係がフェッチおよびインストールされ、英語、ヒンディー語、ベンガル語、タイ語の言語ファイルもインストールされます。

GitHubで利用可能なコード

https://github.com/EisenVault/install-tesseract-redhat-centos

お役に立てれば。

GitHubで利用可能なコード

https://github.com/EisenVault/install-tesseract-redhat-centos

お役に立てれば。

Neeraj Kumar · Answer

ソースからTesseract OCRライブラリをインストールします（2018年7月14日に更新）

LeptonicaおよびTeseractのソースをダウンロードします。

$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz

Leptonicaの構成、コンパイル、インストール：

$ tar xzvf leptonica-1.76.0.tar.gz $ cd leptonica-1.76.0 $ ./configure & make & Sudo make install

Tesseractの構成、コンパイル、インストール：

$ tar xzf tesseract-ocr-3.02.02.tar.gz $ cd tesseract-ocr $ ./autogen.sh & ./configure & make & Sudo make install & Sudo ldconfig

言語ファイルのダウンロード：

ここから英語のファイル（eng.traineddata）をダウンロードしています。ここで言語ファイルの完全なリストを確認し、必要に応じてダウンロードできます。 https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-302

言語（英語）をダウンロードし、tessdataフォルダーにコピーします。

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz $ tar xzf tesseract-ocr-3.02.eng.tar.gz $ Sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

これで、Tesseract OCRがインストールされ、使用できるようになりました。例：

$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng

楽しい！！！

iwilldo · Answer

ここに画像の説明を入力してください

yum install --nogpgcheck tesseract

インストールしてテストした後、次のコマンドを入力します：tesseract --version