web-dev-qa-db-ja.com

メルスペクトログラムとMFCCの違い

Docs here に示されているように、librosaライブラリを使用して音楽セグメントをメルスペクトログラムに変換し、ニューラルネットワークの入力として使用しています。

これが MFCCs とどう違うのですか?いずれかを使用する利点または欠点はありますか?

6
monadoboi

MFCCを取得するには、メルスペクトログラムでDCTを計算します。メルスペクトログラムは、多くの場合、前にログスケールされます。

MFCCは非常に圧縮可能な表現で、Melスペクトログラムでは32〜64バンドの代わりに20または13の係数を使用することがよくあります。 MFCCはもう少し非相関化されており、Gaussian Mixture Modelsのような線形モデルで有益です。大量のデータと畳み込みニューラルネットワークのような強力な分類器を使用すると、多くの場合、メルスペクトログラムのパフォーマンスが向上します。

5
jonnor