いくつかのwavファイルがあります。 SciPy FFTを使用して、これらのwavファイルの周波数スペクトルをプロットしたいと思います。これをどうやってやるの?
Python
は、これをかなり迅速に行うためのいくつかのAPIを提供します。 このリンク から羊の羊のwavファイルをダウンロードします。これをデスクトップに保存し、ターミナル内のcd
に保存できます。 python
プロンプトの次の行で十分です:(>>>
を省略)
import matplotlib.pyplot as plt
from scipy.fftpack import fft
from scipy.io import wavfile # get the api
fs, data = wavfile.read('test.wav') # load the data
a = data.T[0] # this is a two channel soundtrack, I get the first track
b=[(ele/2**8.)*2-1 for ele in a] # this is 8-bit track, b is now normalized on [-1,1)
c = fft(b) # calculate fourier transform (complex numbers list)
d = len(c)/2 # you only need half of the fft list (real signal symmetry)
plt.plot(abs(c[:(d-1)]),'r')
plt.show()
入力信号のプロットは次のとおりです。
ここにスペクトルがあります
正しい出力を得るには、xlabel
をスペクトルプロットの周波数に変換する必要があります。
k = arange(len(data))
T = len(data)/fs # where fs is the sampling frequency
frqLabel = k/T
大量のファイルを処理する必要がある場合は、これを関数として実装できます。これらの行をtest2.py
に追加します。
import matplotlib.pyplot as plt
from scipy.io import wavfile # get the api
from scipy.fftpack import fft
from pylab import *
def f(filename):
fs, data = wavfile.read(filename) # load the data
a = data.T[0] # this is a two channel soundtrack, I get the first track
b=[(ele/2**8.)*2-1 for ele in a] # this is 8-bit track, b is now normalized on [-1,1)
c = fft(b) # create a list of complex number
d = len(c)/2 # you only need half of the fft list
plt.plot(abs(c[:(d-1)]),'r')
savefig(filename+'.png',bbox_inches='tight')
たとえば、現在の作業ディレクトリにtest.wav
とtest2.wav
があります。python
プロンプトインターフェイスで次のコマンドで十分です。import test2 map(test2.f、['test.wav' 、 'test2.wav'])
このようなファイルが100個あり、それらの名前を個別に入力したくない場合、glob
パッケージが必要です。
import glob
import test2
files = glob.glob('./*.wav')
for ele in files:
f(ele)
quit()
。wavファイルが同じビットでない場合は、test2.fにgetparams
を追加する必要があります。
次のコードを使用して変換を実行できます。
#!/usr/bin/env python
# -*- coding: utf-8 -*-
from __future__ import print_function
import scipy.io.wavfile as wavfile
import scipy
import scipy.fftpack
import numpy as np
from matplotlib import pyplot as plt
fs_rate, signal = wavfile.read("output.wav")
print ("Frequency sampling", fs_rate)
l_audio = len(signal.shape)
print ("Channels", l_audio)
if l_audio == 2:
signal = signal.sum(axis=1) / 2
N = signal.shape[0]
print ("Complete Samplings N", N)
secs = N / float(fs_rate)
print ("secs", secs)
Ts = 1.0/fs_rate # sampling interval in time
print ("Timestep between samples Ts", Ts)
t = scipy.arange(0, secs, Ts) # time vector as scipy arange field / numpy.ndarray
FFT = abs(scipy.fft(signal))
FFT_side = FFT[range(N/2)] # one side FFT range
freqs = scipy.fftpack.fftfreq(signal.size, t[1]-t[0])
fft_freqs = np.array(freqs)
freqs_side = freqs[range(N/2)] # one side frequency range
fft_freqs_side = np.array(freqs_side)
plt.subplot(311)
p1 = plt.plot(t, signal, "g") # plotting the signal
plt.xlabel('Time')
plt.ylabel('Amplitude')
plt.subplot(312)
p2 = plt.plot(freqs, FFT, "r") # plotting the complete fft spectrum
plt.xlabel('Frequency (Hz)')
plt.ylabel('Count dbl-sided')
plt.subplot(313)
p3 = plt.plot(freqs_side, abs(FFT_side), "b") # plotting the positive fft spectrum
plt.xlabel('Frequency (Hz)')
plt.ylabel('Count single-sided')
plt.show()