C/C++/Objective-Cの無料/オープンソースのテキスト認識ライブラリを知っている人はいますか?基本的に、画像をスキャンして、すべてのプレーンテキストを読み取ることができるもの。
最も有名なものは Tesseract OCR 最初にMotorolaによって開発され、後にオープンソースになりました。また、Googleによって宣伝されています。
おそらくTesseractほど有名ではないものがいくつかあります: http://en.wikipedia.org/wiki/OCRopushttp://jocr.sourceforge.net/
ここ は、画像から数字を抽出する方法に関する興味深い記事です。
著者は、彼の ニューラルネットワークアルゴリズム をトレーニングするために多数のサンプルを収集し、 OpenCV で画像処理を行うと信じています。
オープンソースOCRライブラリ:1。ABBYYモバイルOCRエンジンは、モバイルおよび小さなフットプリントのアプリケーションの開発者が高精度の光学式文字を統合できるようにする強力なソフトウェア開発キットです。画像や写真を管理可能で検索可能なテキストに変換する認識(OCR)テクノロジー。 Toolkitは、最も人気のあるモバイルプラットフォームとデバイス(iOS(iPhone)とAndroid)をサポートしています。 http://www.abbyy.com/mobileocr/
2.Tesseractはおそらく利用可能な最も正確なオープンソースOCRエンジンです。 https://code.google.com/p/tesseract-ocr/