MP3を取得して、音声をテキストに変換するにはどうすればよいですか?
会議や会議から録音されたメモがいくつかあります(録音には単一の音声があり、これが私の音声です)。私は、単に手で書き写すのではなく、音声テキスト変換ツールを使用してテキストに変換する方が簡単で知的に面白いと思いました。特にアスタリスクとポッドキャストを使用するVoIPアプリケーション向けの技術があることは知っていますが、それらは何で、どのように使用できますか?
オープンソース: CMU Sphinx
シェアウェア: http://www.e-speaking.com/ (Windows)
コマーシャル: Dragon NaturallySpeaking (Windows)
.NETは、System.Speech名前空間を使用してこれを実行できます。
最初に.wavに変換するか、マイクからライブでオーディオをキャプチャする必要があります。
実装の詳細については、こちらをご覧ください。 。NETでの音声の転写
Dragon NaturallySpeaking はMP3入力をサポートしているようです。
オープンソースバージョン が必要な場合(これに基づくAsterisk統合プロジェクトがあると思います)。