web-dev-qa-db-ja.com

集計関数なしでグループ化

私はこのようなpandasqlクエリを見ました:

df = pd.DataFrame({'A': [1, 2, 2], 'B': [3, 4, 5]})
sqldf('select * from df group by A', locals())

これは与える:

   A  B
0  1  3
1  2  6

集計関数なしでgroupbyを使用するのは本当に奇妙だと思いますが、集計列で複数の値を1つに減らすためにどの関数が使用されているかを誰かに教えてもらえますか?

8
zoran119

探しているgroupbyメソッドはlast()のようです。

df = pd.DataFrame({'A': [1, 2, 2], 'B': [3, 4, 5]})
df.groupby('A', as_index=False).last()

出力:

   A  B
0  1  3
1  2  5

これは、5がタイプミス(上記の私のコメントを参照)であり、6であることを意味していると仮定して言っています。

5
Andrew L