音声認識-テキストソフトウェアへのMP3

Question

音声録音（特にポッドキャスト）を含むMP3ファイルをテキストに転記できるスピーカー非依存プログラム（商用または無料）を探しています。 Dragon Naturally Speakingを試してみたかったのですが、それは自分の音声録音のみをサポートしているようです。では、代替案は何ですか？

moioci · Answer

Dragon Naturally Speakingはmp3ファイルをインポートし、それらを文字起こししようとします。個々の話者に合わせて音声認識を調整することを好みますが、調整せずにかなりの仕事をします。ポッドキャストスピーカーの音がTom Brokawのように聞こえる場合は、おそらく最も効果的に機能します。

studiohack · Answer

考えられる解決策の1つは、動画をYouTubeにアップロードして、有効にできる自動キャプションを試すことです...まだ正確ではありませんが、キャプションファイルをダウンロードして自分で編集できます（それが役立つ場合）。曲の著作権/著作権侵害の問題については、可能であれば、プロフィールで動画を非公開にすることもできますか？

nvuono · Answer

私はDragon Naturally Speakingを試すことに対して警告します-私の脱獄したiPhoneにいくつかのスクリプトを書いて、すべてのボイスメールファイルを私の電話から私のPC上のフォルダーにコピー/変換し、それらに対してDragon Naturally Speaking文字起こしサービスを実行しました。

異なるスピーカーのファイルに対して文字起こしを実行した結果は、まったく使用できませんでした。私はいくつかのオープンソースの代替案を試しましたが、スピーカーに依存しない音声認識は、まだ非常に小さな辞書に限定されているようです。

Juan Antonio Tub&#237;o · Answer

私は http://www.voicebase.com をポッドキャストと英語のビデオで使用していますが、非常にうまく機能します。 50オーディオ時間は無料です。

音声文字変換は、rtf、srt、またはpdfでダウンロードできます。

機械の文字起こしは、アップロードしてから約10〜15分後にダウンロードできます。

BlueBerry - Vignesh4303 · Answer

オープンソース： CMU Sphinx

シェアウェア： http://www.e-speaking.com/ （Windows）

コマーシャル： Dragon NaturallySpeaking （Windows）

osx で試してみた場合も、この方法を試すことができます。これは、audacityとsoundflowerを使用して実行できます。

また、 opensource に関連するリンクを見つけることもできます。試してみる価値のある別のシェアウェアは、 voxcribecc

あなたが.netプログラマーであれば、これメソッドを使用して独自のキットを作成できます

Zach · Answer

Podzingerは素晴らしいソリューションですが、ランプ（Podzingerを開発したEveryZingであった会社の新しい名前）が無料でサービスを提供するかどうかはわかりません...

http://en.wikipedia.org/wiki/Podzinger