web-dev-qa-db-ja.com

オーディオ処理用のOpenCVのようなC / C ++ライブラリはありますか?

(精神的に)OpenCVに似ていますが、音声を処理し、そこからインテリジェンスを引き出すための何かがありますか?機能の範囲は次のとおりです。

  1. マルチプラットフォームオーディオキャプチャおよびオーディオ再生
  2. DSP-オーディオフィルター
  3. トーン検出
  4. 色調特性分析
  5. トーン合成(さまざまな標準波形)
  6. いくつかの認識コーパスとモデル(たとえば、楽器、ビート、人間の発話などを決定する)を与えられた認識-実際の認識部分(スフィンクス)に他のオープンソースプロジェクトを使用する可能性があります
  7. 音声/音楽合成-他のオープンソースプロジェクト(フェスティバル)を再び使用する可能性があります

ライブラリが生のオーディオs.tで動作する場合は問題ありません。フォーマット/エンコードの変換は、他の既存のライブラリ(ffmpegからなど)によって処理される外部の問題です。

私はこの分野の専門家ではありませんが、そのようなAPIを使用する必要があり、そのようなライブラリーが存在するかどうか疑問に思っているため、機能を決定するための用語の選択はおそらく最良ではないため、専門家はこの質問を編集することをお勧めします。

49
icarus74

オーディオのキャプチャと再生については、 portaudio が思い浮かびます。

オーディオ処理の場合、 [〜#〜] stk [〜#〜] は有望に見えます。

この関連する質問もご覧ください: C++で適切なDSP /音声ライブラリをお勧めできますか?

次の3つのライブラリをお勧めします。

  1. 非常に使いやすく、一般的な信号処理に優しい Aquila-dsp

  2. オーディオ信号処理用の強力なライブラリ。使用するのは困難ですが、初心者には非常に大きく複雑です。 CLAM Project

  3. 別の経験はありませんが、検討する価値があります。 tspl

32
Jong Bor Lee

Essentia http://essentia.upf.edu/ をご覧ください。Essentiaは、オーディオ分析およびオーディオベースの音楽情報のためのオープンソースのC++ライブラリです。オーディオ入力/出力機能、標準デジタル信号処理ブロック、データの統計的特性、スペクトル、時間、音調、高レベルの音楽記述子の大規模なセットを実装する再利用可能なアルゴリズムの広範なコレクションが含まれています。

OpenFrameworksブランチもありますが、正式には64ビットであるC++ 11が数か月以内になるまで待つことをお勧めします。 https://github.com/GiantSteps/Essentia-Libraries

7
Borg

Gaudioサウンドライブラリを試すことができると思います- http://www.geek-audio.org

Gaudioライブラリは、オーディオのデコード、エンコード、およびdpsをサポートしています。

0
Petx