オーディオファイル(.wav .mp3 ...)を入力し、オーディオファイルのテキストを出力できるソフトウェアを探しています。
そのようなソフトウェアは存在しますか? (ライブ)音声をテキストに変換し、オーディオファイルをテキストに変換しないソフトウェアを見つけました。
あなたがダウンロードできるものは知りませんが、私は不格好な提案をすることができます。
Googleはそのようなソフトウェアを作成しており、YouTubeやGoogle Voiceで使用していることは知っています。
それは あまり良くない ですが、Google Voiceアカウントを呼び出して、留守番電話にピックアップさせ、ボイスメールの録音中にオーディオを再生することができます。
メールにボイスメールの文字起こしが届きます。
Googleのエンジンをトレーニングする必要がないため、これだけをお勧めします。
これは具体的にあなたの質問に答えるものではありませんが、あなたの状況で私がやろうとしていることは、Amazon Mechanical Turkジョブとしてそれを配布することです。このようにすると、おそらく最高の結果が得られ、支払い額も最も少なくなります。
VOICENOTEソフトウェア(無料)をGoogle Voiceに追加できます。それは話をテキストに変換します。次に、スピーカーの音声録音を直接マイクからVOICENOTEに再生します。
VOICENOTEを使用して、メモをテキストに転記し、MS Wordに保存する予定です。その後、ドキュメントを保存すると、Windowsはコンピューター上の手書きのメモを検索できます。それ以外の場合、手書きのメモは画像としてのみ保存できます。タイトルのみが検索可能であり、検索するドキュメントの単語が見つかりません。
eMicrophonesは Windows Speech Recognition Toolkit と呼ばれる商用製品を作成します。これは、*。WAVファイルを転記する機能など、Windows音声認識に多くの便利な機能を追加します。任意の声ではなく、話していました)。機能リストから:
Transcriptionは、デジタルレコーダーから.WAVファイルを読み取り、テキストに転記します。これは、個人のユーザープロファイルを持ち、適切な発音と句読点を使用してコンピューターの前にいるように指示する人が使用するためのものです。会議から複数の声を書き起こすことを意図していません。
「fanscribe」と呼ばれるソフトウェアプロジェクトがあり、録音を分割して断片に分割し、その一部を文字起こしできる興味のある人に配布します。
https://github.com/fanscribe/fanscribe/blob/master/README.rst