Mp3からtxtへの簡単なコンバーターを探しています。成功せずに試しました:julius、CMU Sphinx、...過去4時間で、それらの使用方法(または適切にインストール)が見つかりませんでした。
私が探しているのは次のようなものです:
$ converterapp -infile myspeech.mp3 -outfile myspeech.txt
変換するファイルが数個しかないため、GUIアプリケーションでも問題ありません。
編集:この答えの助けを借りて MP3をテキストに変換する音声認識アプリ? 私はそれを動作させるようにしたが、出力を生成しません。まあ、実際には2、3の空白行が生成されます(単語は検出されません).
pocketsphinxは、既存のオーディオファイルからテキストを読み上げます。 mp3の初期形式によっては、2つの別個のコマンドが必要になる場合があります。
まず、既存のオーディオファイルを必須の入力形式に変換します。
ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
ランポケットスフィンクス
pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt
作成されたファイルmyspeech.txtには、探しているものが含まれています。
Ubuntuを初めて使用する場合は、次のコマンドを使用して上記のプログラムをインストールする必要があります。
Sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg