web-dev-qa-db-ja.com

Python pandas:変数をカウントするデータフレームに列を追加します

次のようなデータフレーム「gt」があります:

org     group
org1      1
org2      1
org3      2
org4      3
org5      3
org6      3

そして、列の「count」をgtデータフレームに追加して、グループのメンバーの数をカウントしたいと思います。期待される結果は次のとおりです。

org     group   count
org1      1       2
org2      1       2
org3      2       1
org4      3       3
org5      3       3
org6      3       3

私はグループの1つのアイテムごとにそれを行う方法を知っていますが、すべてのグループアイテムについてカウントを繰り返す方法を知りません、私が使用したコードは次のとおりです:

gtcounts = gt.groupby('group').count()

誰でも助けることができますか?

23
UserYmY

transform を呼び出すと、元のdfに揃えられたSeriesが返されます。

In [223]:

df['count'] = df.groupby('group')['group'].transform('count')
df
Out[223]:
    org  group  count
0  org1      1      2
1  org2      1      2
2  org3      2      1
3  org4      3      3
4  org5      3      3
5  org6      3      3
39
EdChum