web-dev-qa-db-ja.com

CentOS6へのTesseract-OCRのインストール

サーバーにTesseract-OCRをインストールしようとしていますが、正しいリポジトリであると思われるものをすべてインストールすると、インストールしようとすると、パッケージが見つかりません

Rpmforgeを追加しようとしましたが、役に立ちませんでした。以前に行ったことがある、またはリポジトリの追加と検索に精通している誰かからのアイデアはありますか?

8
William

Centosで正しく機能するこれらの手順を使用しました

CentosのソースからTesseract OCRライブラリをインストールします

LeptonicaおよびTeseractのソースをダウンロードします。

$ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
$ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

Libsを構成、コンパイル、インストールします。

 $ tar xzvf leptonica-1.69.tar.gz      
 $ cd leptonica-1.69      
 $ ./configure
 $ make
 $ Sudo make install

 $ tar xzf tesseract-ocr-3.02.02.tar.gz
 $ cd tesseract-3.01
 $ ./autogen.sh
 $ ./configure
 $ make
 $ Sudo make install
 $ Sudo ldconfig

言語(英語)をダウンロードし、tessdataフォルダーにコピーします。

$ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz       
$ tar xzf tesseract-ocr-3.02.eng.tar.gz       
$ Sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

そしてそれを楽しんでください;)

7
Yusef Mohamadi

ここでrpmからインストールしてみることをお勧めします: http://pkgs.org/download/tesseract いくつかの依存関係もあります:libpng-devel、libjpeg-devel、libtiff-devel、zlib、leptonica。最後の2つはRPMサイトでも見つけることができます

5
user3133914

これは私のために働いた:

/usr/bin/yum --enablerepo epel-testing install tesseract.x86_64 tesseract-langpack-fra.noarch

tesseractはepelリポジトリにはありませんが、epel-testingリポジトリにはデフォルトでアクティブ化されていません。

4
Little Gecko

Centos7にTesseract3.05をインストールするためのbashスクリプトを作成しました。これにより、すべての依存関係がフェッチおよびインストールされ、英語、ヒンディー語、ベンガル語、タイ語の言語ファイルもインストールされます。

GitHubで利用可能なコード

https://github.com/EisenVault/install-tesseract-redhat-c​​entos

お役に立てれば。

4
Vipul Swarup

ソースからTesseract OCRライブラリをインストールします(2018年7月14日に更新)

LeptonicaおよびTeseractのソースをダウンロードします。

$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz

Leptonicaの構成、コンパイル、インストール:

$ tar xzvf leptonica-1.76.0.tar.gz
$ cd leptonica-1.76.0
$ ./configure & make & Sudo make install

Tesseractの構成、コンパイル、インストール:

$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-ocr
$ ./autogen.sh & ./configure & make & Sudo make install & Sudo ldconfig

言語ファイルのダウンロード:

ここから英語のファイル(eng.traineddata)をダウンロードしています。ここで言語ファイルの完全なリストを確認し、必要に応じてダウンロードできます。 https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-302

言語(英語)をダウンロードし、tessdataフォルダーにコピーします。

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ Sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

これで、Tesseract OCRがインストールされ、使用できるようになりました。例:

$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng

楽しい!!!

3
Neeraj Kumar

ここに画像の説明を入力してください

yum install --nogpgcheck tesseract

インストールしてテストした後、次のコマンドを入力します:tesseract --version

0
iwilldo