これは主に単なる好奇心ですが、純粋なJavaにOCR実装はありますか?私はこれが純粋にJavaでどのように実行されるのか興味があり、OCRは一般的に私に興味がありますので、私が完全に理解している言語でどのように実装されるかを見てみたいです。当然、これには実装がオープンソースである必要がありますが、少なくともその場合のパフォーマンスを確認できるので、私はまだ独自のソリューションに興味があります。
Javaで使用できるカップルを見ました( Asprise など)が、これらは純粋なJava実装ではないようです...いずれかがあります?
非常に拡張可能なオプションを探している場合、または特定の問題ドメインがある場合は、 Java Object Oriented Neural Engine を使用して独自のロールを検討することができます。別の JOONE 参照。
this などの画像から文字を識別するために個人プロジェクトで正常に使用しました。githubでアプリケーションのOCRコンポーネントのすべてのソースを見つけることができます here 。
Tesseract、Asprise、AbbyyなどのJavaでいくつかのOCRエンジンをテストしました。分析では、Abbyyが最良の結果を出しました。
さまざまなOCRライブラリがあります。ただし、私の経験では、主要な商用実装であるABBYY、Omnipage、およびReadIrisは、オープンソースやその他のマイナーな実装をはるかに上回っています。これらの商用ライブラリは、Javaで動作するように主に設計されていませんが、もちろん可能です。
もちろん、コードの学習に興味がある場合は、オープンソースの実装がトリックを行います。
ちょうどこれを見つけました(テストせずに、自分で確認してください)
これは好奇心のためだけに必要なので、このアプレットのソースを調べることができます。
手書き文字のOCRをニューラルネットワークで実行します