私は、視覚障害者が印刷された紙に書かれた文章を聞くのを助けるプロジェクトに取り組んでいます。印刷されたテキスト画像をデジタル書き込みでPDFファイルに変換する部分を扱いました。今、私はespeakがその文章にアクセスし、Pythonを使用してそれを大声で読みたいと思っています。誰かがガイドできますか?
tesseract-ocr -の出力をパイプ処理することにより、コマンドラインから非常に簡単な画像から音声への変換を実行できます。 ( 話す。これは、画像ソースから直接コーディングや変換を行わなくても実行できます。
tesseract image.png stdout | espeak