web-dev-qa-db-ja.com

トランスクリプト作成者OR音声からテキストへ

私は約4時間の毎日のポッドキャストを聴いています。トランスクリプトを自動的に生成する方法があれば、すばらしいプロジェクトになると思います。 mp3を「リッスン」し、彼らが言っていることのテキストを作成するソフトウェアはありますか?

質問が多すぎると思うので、誰が話しているのかを区別することにはあまり関心がありません。話す主な人は4人で、他の人はそれほど頻繁ではありません。

3
AndyMcKenna

手順:

  1. ダウンロード Express Scribe 無料のトランスクリプションプレーヤーとインストール。
    1. アプリケーションがインストールされると、すでにロードされているディクテーションファイルの例が見つかります。これにより、ニーズに合わせてアプリケーションを設定するためのコントロールとオプションを試してみることができます。
    2. メインインターフェイスから[設定]ボタンをクリックします。
    3. Express Scribeを使用すると、巻き戻し速度と早送り速度、システム全体のホットキー(マウスを使用せずにアプリケーションを制御するため)、フットペダルコントロールのセットアップ(ある場合)、ファイルの自動読み込みなど、かなりの数のパラメーターを変更または設定できます。 LANフォルダまたはFTPサーバーから、許可するファイルタイプの選択(20以上をサポート)および音声認識エンジンのセットアップ。
    4. オプションを設定したら、最初のオーディオファイルをロードできます。受信元に応じて、[ロード](PC上のファイルを参照できるダイアログボックスが開きます)、[今すぐロード](LANまたはFTP接続を設定している場合)、または[ドッキング]をクリックできます。 (デジタルまたはカセットディクテーションレコーダーを携帯する必要がある場合)。
    5. メインインターフェイスウィンドウでオーディオファイルを選択し、[再生]ボタンをクリックして開始します。必要に応じて、右下隅の速度コントロールを使用して、オーディオの再生を遅くしたり速くしたりします。このコントロールの上で、再生音量を調整することもできます。
    6. Express Scibeをワードプロセッシングアプリケーションの上に浮かせたい場合は、メインインターフェイスツールバーからScribeMiniを選択できます。名前が示すように、このオプションはアプリケーションのミニチュアバージョンを提供します。
    7. オーディオファイルの文字起こしが完了したら、「完了」(リストからファイルを削除)または「ディスパッチ」(trext添付ファイルと一緒に元の送信者にメールで返信してリストからオーディオファイルを削除)としてマークできます。 。

チップ

  • 時間をかけて、アプリケーションのすべてのオプションを調べてください。
  • 低品質のオーディオファイルを受け取った場合は、[ファイル]メニューから[特別なオーディオプロセス]を選択して、クリーンアップを試みることができます。
  • Express Scribeがオーディオファイルを受信すると、C:\ Documents and Settings\username\Application Data\NCH Swift Sound\scribe\Current)に保存されます。
  • オーディオファイルを「完了」としてマークしたが、それを取得したい場合は、「ファイル」メニューから古いファイルを回復できます。
3
ToreTrygg

あなたが試すことができる1つのことは(毎日ではありませんが)オーディオをビデオとしてYoutubeにアップロードし、YouTubeにビデオを転記するように依頼し、英語のキャプションを与えることです... YouTubeがこれを行うには最大24時間かかることがありますただし...キャプションファイルはダウンロード可能であり、自分で編集できるため、テキストをコピーして好きな場所に貼り付けることができます...

1
studiohack

試しました ウェーブからテキスト ?これはWindowsのみであり、無料トライアルは限られています。

これらのファイルにはいくつのボイスがありますか?すべてのファイルに1つの(トレーニング可能な)音声からの音声が含まれていますか?音質はどうですか?これらの質問に対する答えが「Justme」、「Yes」、および「CD Quality」ではない場合、@ Snarkは正しいです。これは、基本的に手動で行う必要があります。優れた音声認識プログラムを入手し、トレーニングに時間をかけ、ファイルを再生しながら、彼らの言うことを話そうとします。

約90%〜95%の文字起こしの成功を期待してください。これは、20語ごとに1つまたは2つが間違っていることに気付くまでは素晴らしい音です。

精度に影響を与える可能性のあるその他の要因:

  1. あなたのスピーチにはたくさんの頭字語があります
  2. 不完全な文-音声からテキストへの変換は、完全な文から得られるコンテキストの手がかりを使用すると、はるかに優れたパフォーマンスを発揮する傾向があります。
0
DaveParillo

音声文字変換にDragon NaturalSpeakingを使用しています。優れたソフトウェア!

しかし、それは無料ではありません。Amazonは実際の バージョン10は45ドル を提供しています。周りを見回すと、DNS9がさらに安くなります。

0
Molly7244

このような状況でドラゴンスピーチを使用する場合の問題は、スピーチを正確に解釈することを学習するトレーニングプロセスを実際に実行できないことです。この種の使用を目的としたものではありません。たぶんNSAには、この種のことを行うためのソフトウェアがいくつかあります。:)

0
user33795

音声認識ソフトウェア が必要です。

そのためのプログラムはいくつかありますが、バッチ変換ができるプログラムはありません。私はそれがそれらの少なくとも1つの機能であるとかなり確信しています。それらのほとんどは決して安くはないことに注意してください。

0
Snark