web-dev-qa-db-ja.com

Pythonの相関行列を使用してクラスターを作成します

全部で、21の産業セクターの相関行列があります。次に、これら21のセクターを4つまたは5つのグループに分割し、同様の動作のセクターをグループ化します。

Pythonでこれを行う方法について専門家が私にいくつかの光を当てることができますか?事前に感謝します!

5
Jasper C.

Pandas DataFrame.corr および scipy.cluster 階層クラスタリングパッケージ

import pandas as pd
import scipy.cluster.hierarchy as spc


df = pd.DataFrame(my_data)
corr = df.corr().values

pdist = spc.distance.pdist(corr)
linkage = spc.linkage(pdist, method='complete')
idx = spc.fcluster(linkage, 0.5 * pdist.max(), 'distance')
8
Wes Doyle