web-dev-qa-db-ja.com

pandasピボットテーブルの列名の変更

pandasピボット操作の後で複数のレベルを持つ列の名前を変更する方法は?

テストデータを生成するコードは次のとおりです。

import pandas as pd
df = pd.DataFrame({
    'c0': ['A','A','B','C'],
    'c01': ['A','A1','B','C'],
    'c02': ['b','b','d','c'],
    'v1': [1, 3,4,5],
    'v2': [1, 3,4,5]})

print(df)

テストデータフレームを与える:

   c0 c01 c02  v1  v2
0  A   A   b   1   1
1  A  A1   b   3   3
2  B   B   d   4   4
3  C   C   c   5   5

ピボットを適用する

df2 = pd.pivot_table(df, index=["c0"], columns=["c01","c02"], values=["v1","v2"])
df2 = df2.reset_index()

与える

output1

レベルを結合して列の名前を変更するにはどうすればよいですか?形式<c01 value>_<c02 value>_<v1>

たとえば、最初の列は"A_b_v1"のようになります。

レベルに参加する順序は、私にとってそれほど重要ではありません。

8
muon

インデックスレベルの順序を気にせずにマルチインデックスを単一の文字列インデックスに結合する場合は、列に対してmap a join関数を実行し、結果リストを割り当てるだけです。

df2.columns = list(map("_".join, df2.columns))

そしてあなたの質問のために、各要素がタプルである列をループし、タプルをアンパックし、それらをあなたが望む順序で結合することができます:

df2 = pd.pivot_table(df, index=["c0"], columns=["c01","c02"], values=["v1","v2"])

# Use the list comprehension to make a list of new column names and assign it back
# to the DataFrame columns attribute.
df2.columns = ["_".join((j,k,i)) for i,j,k in df2.columns]
df2.reset_index()

enter image description here

12
Psidom