複雑な印刷された数式をスキャンできるオープンOCRライブラリが必要です(たとえば、LaTeXを介して生成された数式)。 LaTeXに似た出力(またはASTに似たデータ)を取得したい。
すでにこのようなものはありますか?または、現在のOCR技術者は行指向のテキストを解析するだけですか?
(私は Metaoptimizeに関するこの質問 を投稿していることに注意してください。一部の人々は追加の知識を持っているかもしれません。)
この問題は、OpenAIでも im2latex と記述されていました。
SESHATは、手書きの数式を認識するためのC++で書かれたオープンソースシステムです。 SESHATは、バレンシア大学政治学研究所のPRHLT研究センターで博士論文の一部として開発されました。
オンラインデモ: http://cat.prhlt.upv.es/mer/
ソース: https://github.com/falvaro/seshat
Seshatは、手書きの数式を認識するためのオープンソースシステムです。ストロークのシーケンスとして表されるサンプルが与えられると、パーサーはLaTeXまたはInkMLやMathMLのような他の形式に変換することができます。
私が知っているのはInftyReaderだけです。それはフリーソフトウェアではありません(お金は非営利組織、IIRCに送られているようです)。
http://www.sciaccess.net/en/InftyReader/
なぜPDFがLaTeXにメタデータを持てないのか?のように、LaTeXの式を入れてください!これはとても難しいのですか?(PDF構文ですが、実行できると思います)。
LaTeX構文は、数学表記法の1つの試行された真の標準です。 MathMLやその他のものを作成した人々がこれを考慮に入れていないことは驚くほど愚かに思えます。 InftyReaderはMathMLまたはLaTeX構文を生成します。
HTML(純粋)が必要な場合は、TTHを使用してLaTeX構文を読み取ります。ただ動作します。
ABBYY FineReader(優れたOCRプログラム)は、Math用にソフトウェアをトレーニングできると主張していますが、これは非常に頭が痛い(誰に時間がありますか?)
また、Unicodeには多くの数学記号があります。今日のOCRリーダーが理解できないことは、ソフトウェアの残念な状態と、このアクティビティの脳の赤字を示しています。
「一度に1つのシンボル」に関して、TeXは明らかにシンボルを配置する場所に関するルールを持っています。それらのルールを知っているソフトウェアを書くことはできませんか?! TeXはパブリックドメインです!彼らは商業製品で「それを使用する」ことができます。
Metaoptimizeに関する回答 および Tesseractメーリングリストでの議論 によると、それを実現できるオープン/無料のソリューションはまだないようです。
それを行うことができると思われる唯一の解決策(ただし、Windows専用で非フリーなので確認できません)は、他のいくつかの人々が言及したように、 InftyProject です。
「 Web Equation 」を確認してください。手書きの方程式をLaTeX、MathML、またはSymbolTreeに変換できます。エンジンがオープンソースかどうかはわかりません。
現在の技術は一度に1つのシンボルを読み取ることを考慮して( http://detexify.kirelabs.org/classify.html を参照)、完全な数式のOCRがあるとは思えません。
Inftyはかなりうまく機能します。私の前の会社はそれを視覚障害者のために方程式を読み上げるアプリケーションに統合し、ユーザーから良いフィードバックを得ています。
複雑な数式の数学OCRからの出力にはバグがある可能性が高いため、人間でも問題が発生する可能性があるため、少なくとも問題がある場合は、この結果を校正する必要があります。 (人間の)校正者は結果を修正する必要があります。つまり、数式エディタが必要です。人間が必要とする労力、おそらく限られた複雑な数式のコーパスを考えると、タスクを人間に割り当てる方が簡単だと思うかもしれません。
研究上の問題として、OCRを介して数学を読むのは楽しいです。2次元文法の形式主義と記号認識機能が必要です。
ここで既に言及した参考文献に加えて、これをグーグルで検索してみませんか?カリフォルニア工科大学、ロチェスター、U。ウォータールー、カリフォルニア大学バークレー校で行われた研究があります。どれだけすぐに使用できる状態になっていますか?ダンノ.
ご存知のように、Win7にはそのためのアプリケーションがあります: Math Input Panel 。手書き入力も処理します(実際に作成されています)。 Win7をお持ちの場合は無料です!
それは無料です。手書きの数学をLaTexまたは印刷された数学に変換するには、MyScriptが最適なオプションですが、そのアプリには数ドルかかります。
この素晴らしい短いビデオがあります: http://www.youtube.com/watch?v=LAJm3J36tLQ Fine Readerを認識させる方法を説明します数学の公式。 Fine Readerを既に使用している場合は、1つのツールを使用することをお勧めします。もちろん、それはフリーウェアではありません:(