web-dev-qa-db-ja.com

パンダの特定の列インデックスに列を挿入する方法

パンダの特定の列インデックスに列を挿入できますか?

import pandas as pd
df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]})
df['n'] = 0

これは、列ndfの最後の列として配置しますが、dfに先頭にnを配置するように指示する方法はありませんか。

135
HappyPy

ドキュメントを参照してください。 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.insert.html

loc = 0を使用すると先頭に挿入されます

df.insert(loc, column, value)

df = pd.DataFrame({'B': [1, 2, 3], 'C': [4, 5, 6]})

df
Out: 
   B  C
0  1  4
1  2  5
2  3  6

idx = 0
new_col = [7, 8, 9]  # can be a list, a Series, an array or a scalar   
df.insert(loc=idx, column='A', value=new_col)

df
Out: 
   A  B  C
0  7  1  4
1  8  2  5
2  9  3  6
266
Jeff

リストとして列を抽出し、必要に応じてこれをマッサージして、データフレームのインデックスを再作成することができます。

>>> cols = df.columns.tolist()
>>> cols = [cols[-1]]+cols[:-1] # or whatever change you need
>>> df.reindex(columns=cols)

   n  l  v
0  0  a  1
1  0  b  2
2  0  c  1
3  0  d  2

編集:これは一行で行うことができます。しかし、これは少し見苦しいようです。たぶんよりきれいな提案が来るかもしれません...

>>> df.reindex(columns=['n']+df.columns[:-1].tolist())

   n  l  v
0  0  a  1
1  0  b  2
2  0  c  1
3  0  d  2
10
Nic