音声録音(特にポッドキャスト)を含むMP3ファイルをテキストに転記できるスピーカー非依存プログラム(商用または無料)を探しています。 Dragon Naturally Speakingを試してみたかったのですが、それは自分の音声録音のみをサポートしているようです。では、代替案は何ですか?
Dragon Naturally Speakingはmp3ファイルをインポートし、それらを文字起こししようとします。個々の話者に合わせて音声認識を調整することを好みますが、調整せずにかなりの仕事をします。ポッドキャストスピーカーの音がTom Brokawのように聞こえる場合は、おそらく最も効果的に機能します。
考えられる解決策の1つは、動画をYouTubeにアップロードして、有効にできる自動キャプションを試すことです...まだ正確ではありませんが、キャプションファイルをダウンロードして自分で編集できます(それが役立つ場合)。曲の著作権/著作権侵害の問題については、可能であれば、プロフィールで動画を非公開にすることもできますか?
私はDragon Naturally Speakingを試すことに対して警告します-私の脱獄したiPhoneにいくつかのスクリプトを書いて、すべてのボイスメールファイルを私の電話から私のPC上のフォルダーにコピー/変換し、それらに対してDragon Naturally Speaking文字起こしサービスを実行しました。
異なるスピーカーのファイルに対して文字起こしを実行した結果は、まったく使用できませんでした。私はいくつかのオープンソースの代替案を試しましたが、スピーカーに依存しない音声認識は、まだ非常に小さな辞書に限定されているようです。
私は http://www.voicebase.com をポッドキャストと英語のビデオで使用していますが、非常にうまく機能します。 50オーディオ時間は無料です。
音声文字変換は、rtf、srt、またはpdfでダウンロードできます。
機械の文字起こしは、アップロードしてから約10〜15分後にダウンロードできます。
オープンソース: CMU Sphinx
シェアウェア: http://www.e-speaking.com/ (Windows)
コマーシャル: Dragon NaturallySpeaking (Windows)
osx で試してみた場合も、この方法を試すことができます。これは、audacityとsoundflowerを使用して実行できます。
また、 opensource に関連するリンクを見つけることもできます。試してみる価値のある別のシェアウェアは、 voxcribecc
あなたが.netプログラマーであれば、これ メソッド を使用して独自のキットを作成できます
Podzingerは素晴らしいソリューションですが、ランプ(Podzingerを開発したEveryZingであった会社の新しい名前)が無料でサービスを提供するかどうかはわかりません...