次のようなデータフレーム「gt」があります:
org group
org1 1
org2 1
org3 2
org4 3
org5 3
org6 3
そして、列の「count」をgtデータフレームに追加して、グループのメンバーの数をカウントしたいと思います。期待される結果は次のとおりです。
org group count
org1 1 2
org2 1 2
org3 2 1
org4 3 3
org5 3 3
org6 3 3
私はグループの1つのアイテムごとにそれを行う方法を知っていますが、すべてのグループアイテムについてカウントを繰り返す方法を知りません、私が使用したコードは次のとおりです:
gtcounts = gt.groupby('group').count()
誰でも助けることができますか?
transform
を呼び出すと、元のdfに揃えられたSeriesが返されます。
In [223]:
df['count'] = df.groupby('group')['group'].transform('count')
df
Out[223]:
org group count
0 org1 1 2
1 org2 1 2
2 org3 2 1
3 org4 3 3
4 org5 3 3
5 org6 3 3