これはかなり簡単だと思われますが、ほぼ1日たっても解決策が見つかりませんでした。私はデータフレームにread_csvをロードし、日付と時間の列を簡単に解析、結合、インデックス付けして1つの列に入れましたが、今、あなたができることと同様の時間と分のグループ化に基づいて計算を変更し、実行できるようにしたいですExcelピボット。
私は時間または分にリサンプリングする方法を知っていますが、各時間/分に関連付けられた日付部分を維持しますが、Excelピボットでグループ化して「時間」と「分」を選択するのと同様にデータセットのみを時間と分に集約します他のものは選択しません。
どんな助けも大歓迎です。
できません、df
はDataFrameです:
times = pd.to_datetime(df.timestamp_col)
df.groupby([times.hour, times.minute]).value_col.sum()
このタイプのgroupbyを探していたときに、これに出くわしました。上記のWesのコードはうまくいきませんでしたが、pandas
の経時的な変化によるものかどうかはわかりません。
pandas 0.16.2
、私が最後にしたことは:
grp = data.groupby(by=[data.datetime_col.map(lambda x : (x.hour, x.minute))])
grp.count()
グループ化されたインデックスとして(時間、分)タプルがあります。マルチインデックスが必要な場合:
grp = data.groupby(by=[data.datetime_col.map(lambda x : x.hour),
data.datetime_col.map(lambda x : x.minute)])