ユーザー項目アクティビティデータをピボットすることで、pivot_table()です。メソッドを使用して、ユーザー項目アクティビティデータをピボットしてユーザー項目行列を作成します。しかし、データフレームは非常に大きいので、このように不満がありました。
スタッキングされていないデータフレームが大きすぎ、原因となりますInt32オーバーフロー
この問題を解決するという提案は?ありがとう!
r_matrix = df.pivot_table(values='rating', index='userId', columns='movieId')
_
代わりにgroupby
を使用できます。このコードを試してください:
reviews.groupby(['userId','movieId'])['rating'].max().unstack()
_
いくつかの解決策:
df.groupby('EVENT_ID')['DIAGNOSIS'].apply(list).to_dict()
のような辞書フォーマットにデータを設定できます。