Python Pandas：group byでグループ分けして平均？

Question

私はこのようなデータフレームを持っています：

cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6

クラスターあたりの組織ごとの平均時間を計算したいです。

期待される結果：

cluster mean(time) 1 15 ((8+6)/2+23)/2 2 54 (74+34)/2 3 6

私はパンダでそれをする方法がわからない、誰かが助けることができますか？

Zero · Accepted Answer

あなたが最初に['cluster', 'org']の組み合わせを意味し、次に再びclusterグループを意味するようにしたい場合

In [59]: (df.groupby(['cluster', 'org'], as_index=False).mean() .groupby('cluster')['time'].mean()) Out[59]: cluster 1 15 2 54 3 6 Name: time, dtype: int64

clusterだけで値を意味しないのであれば、

In [58]: df.groupby(['cluster']).mean() Out[58]: time cluster 1 12.333333 2 54.000000 3 6.000000

['cluster', 'org']にgroupbyを付けてmean()を取ることもできます

In [57]: df.groupby(['cluster', 'org']).mean() Out[57]: time cluster org 1 a 438886 c 23 2 d 9874 h 34 3 w 6

Vincepay · Answer

私は単純にこれをするでしょう、それは文字通りあなたの望む論理が何であったかに従います：

df.groupby(['org']).mean().groupby(['cluster']).mean()