web-dev-qa-db-ja.com

音声認識-テキストソフトウェアへのMP3

音声録音(特にポッドキャスト)を含むMP3ファイルをテキストに転記できるスピーカー非依存プログラム(商用または無料)を探しています。 Dragon Naturally Speakingを試してみたかったのですが、それは自分の音声録音のみをサポートしているようです。では、代替案は何ですか?

16
pako

Dragon Naturally Speakingはmp3ファイルをインポートし、それらを文字起こししようとします。個々の話者に合わせて音声認識を調整することを好みますが、調整せずにかなりの仕事をします。ポッドキャストスピーカーの音がTom Brokawのように聞こえる場合は、おそらく最も効果的に機能します。

7
moioci

考えられる解決策の1つは、動画をYouTubeにアップロードして、有効にできる自動キャプションを試すことです...まだ正確ではありませんが、キャプションファイルをダウンロードして自分で編集できます(それが役立つ場合)。曲の著作権/著作権侵害の問題については、可能であれば、プロフィールで動画を非公開にすることもできますか?

4
studiohack

私はDragon Naturally Speakingを試すことに対して警告します-私の脱獄したiPhoneにいくつかのスクリプトを書いて、すべてのボイスメールファイルを私の電話から私のPC上のフォルダーにコピー/変換し、それらに対してDragon Naturally Speaking文字起こしサービスを実行しました。

異なるスピーカーのファイルに対して文字起こしを実行した結果は、まったく使用できませんでした。私はいくつかのオープンソースの代替案を試しましたが、スピーカーに依存しない音声認識は、まだ非常に小さな辞書に限定されているようです。

2
nvuono

私は http://www.voicebase.com をポッドキャストと英語のビデオで使用していますが、非常にうまく機能します。 50オーディオ時間は無料です。

音声文字変換は、rtf、srt、またはpdfでダウンロードできます。

機械の文字起こしは、アップロードしてから約10〜15分後にダウンロードできます。

1

オープンソース: CMU Sphinx

シェアウェア: http://www.e-speaking.com/ (Windows)

コマーシャル: Dragon NaturallySpeaking (Windows)

osx で試してみた場合も、この方法を試すことができます。これは、audacityとsoundflowerを使用して実行できます。

また、 opensource に関連するリンクを見つけることもできます。試してみる価値のある別のシェアウェアは、 voxcribecc

あなたが.netプログラマーであれば、これ メソッド を使用して独自のキットを作成できます

Podzingerは素晴らしいソリューションですが、ランプ(Podzingerを開発したEveryZingであった会社の新しい名前)が無料でサービスを提供するかどうかはわかりません...

http://en.wikipedia.org/wiki/Podzinger

0
Zach