全部で、21の産業セクターの相関行列があります。次に、これら21のセクターを4つまたは5つのグループに分割し、同様の動作のセクターをグループ化します。
Pythonでこれを行う方法について専門家が私にいくつかの光を当てることができますか?事前に感謝します!
Pandas DataFrame.corr
および scipy.cluster
階層クラスタリングパッケージ
import pandas as pd
import scipy.cluster.hierarchy as spc
df = pd.DataFrame(my_data)
corr = df.corr().values
pdist = spc.distance.pdist(corr)
linkage = spc.linkage(pdist, method='complete')
idx = spc.fcluster(linkage, 0.5 * pdist.max(), 'distance')