web-dev-qa-db-ja.com

pandas DataFrameから特定の列を「アンピボット」するにはどうすればよいですか?

pandas DataFrameがあります。例:

x = DataFrame.from_dict({'farm' : ['A','B','A','B'], 
                         'fruit':['Apple','Apple','pear','pear'], 
                         '2014':[10,12,6,8], 
                         '2015':[11,13,7,9]})

つまり:

   2014  2015 farm  fruit
0    10    11    A  Apple
1    12    13    B  Apple
2     6     7    A   pear
3     8     9    B   pear

どうすればこれに変換できますか?

  farm  fruit  value  year
0    A  Apple     10  2014
1    B  Apple     12  2014
2    A   pear      6  2014
3    B   pear      8  2014
4    A  Apple     11  2015
5    B  Apple     13  2015
6    A   pear      7  2015
7    B   pear      9  2015

私はstackunstackを試してみましたが、機能させることができませんでした。

ありがとう!

24
Racing Tadpole

これはpd.melt()で行うことができます:

# value_name is 'value' by default, but setting it here to make it clear
pd.melt(x, id_vars=['farm', 'fruit'], var_name='year', value_name='value')

結果:

  farm  fruit  year  value
0    A  Apple  2014     10
1    B  Apple  2014     12
2    A   pear  2014      6
3    B   pear  2014      8
4    A  Apple  2015     11
5    B  Apple  2015     13
6    A   pear  2015      7
7    B   pear  2015      9

[8 rows x 4 columns]

この種の操作の名前として「melt」がどれほど一般的であるかはわかりませんが、それがRのreshape2パッケージで呼ばれているため、おそらくここで名前が付けられました。

27
Marius