web-dev-qa-db-ja.com

音声(mp3オーディオファイル)をテキストに変換する

Mp3からtxtへの簡単なコンバーターを探しています。成功せずに試しました:julius、CMU Sphinx、...過去4時間で、それらの使用方法(または適切にインストール)が見つかりませんでした。

私が探しているのは次のようなものです:

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

変換するファイルが数個しかないため、GUIアプリケーションでも問題ありません。

編集:この答えの助けを借りて MP3をテキストに変換する音声認識アプリ? 私はそれを動作させるようにしたが、出力を生成しません。まあ、実際には2、3の空白行が生成されます(単語は検出されません).

8
Samo

pocketsphinxは、既存のオーディオファイルからテキストを読み上げます。 mp3の初期形式によっては、2つの別個のコマンドが必要になる場合があります。

まず、既存のオーディオファイルを必須の入力形式に変換します。

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

ランポケットスフィンクス

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

作成されたファイルmyspeech.txtには、探しているものが含まれています。


Ubuntuを初めて使用する場合は、次のコマンドを使用して上記のプログラムをインストールする必要があります。

    Sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg
2
64pi0r