web-dev-qa-db-ja.com

Pandas:INT32オーバーフロー?ピボットテーブルを構築できません

ユーザー項目アクティビティデータをピボットすることで、pivot_table()です。メソッドを使用して、ユーザー項目アクティビティデータをピボットしてユーザー項目行列を作成します。しかし、データフレームは非常に大きいので、このように不満がありました。

スタッキングされていないデータフレームが大きすぎ、原因となりますInt32オーバーフロー

この問題を解決するという提案は?ありがとう!

r_matrix = df.pivot_table(values='rating', index='userId', columns='movieId')
 _
4
JoFox

代わりにgroupbyを使用できます。このコードを試してください:

reviews.groupby(['userId','movieId'])['rating'].max().unstack()
 _
1
Hamid

いくつかの解決策:

  • あなたはあなたのpandasバージョンから0.21が大きいデータで問題ない0.21にダウングレードできます。
  • df.groupby('EVENT_ID')['DIAGNOSIS'].apply(list).to_dict()のような辞書フォーマットにデータを設定できます。
0
dasmehdix