web-dev-qa-db-ja.com

Pandasデータフレーム内の列をintから文字列に変換する

Intとstrのデータ列が混在するパンダのデータフレームがあります。最初にデータフレーム内の列を連結します。そのためには、int列をstrに変換する必要があります。私は次のようにしようとしました:

mtrx['X.3'] = mtrx.to_string(columns = ['X.3'])

または

mtrx['X.3'] = mtrx['X.3'].astype(str)

しかし、どちらの場合も機能せず、「 'str'オブジェクトと 'int'オブジェクトを連結できません」というエラーが表示されます。 2つのstr列の連結は完全に正常に機能しています。

76
Malfet
In [16]: df = DataFrame(np.arange(10).reshape(5,2),columns=list('AB'))

In [17]: df
Out[17]: 
   A  B
0  0  1
1  2  3
2  4  5
3  6  7
4  8  9

In [18]: df.dtypes
Out[18]: 
A    int64
B    int64
dtype: object

シリーズを変換する

In [19]: df['A'].apply(str)
Out[19]: 
0    0
1    2
2    4
3    6
4    8
Name: A, dtype: object

In [20]: df['A'].apply(str)[0]
Out[20]: '0'

結果を戻すことを忘れないでください:

df['A'] = df['A'].apply(str)

フレーム全体を変換する

In [21]: df.applymap(str)
Out[21]: 
   A  B
0  0  1
1  2  3
2  4  5
3  6  7
4  8  9

In [22]: df.applymap(str).iloc[0,0]
Out[22]: '0'
df = df.applymap(str)
89
Jeff

DataFrame列のデータ型を変更します。

Intに:

df.column_name = df.column_name.astype(np.int64)

Strに:

df.column_name = df.column_name.astype(str)

69
tanaque

警告:両方の解決策が与えられたastype()およびapply()nan形式またはNone形式のNULL値は保持されません。

import pandas as pd
import numpy as np

df = pd.DataFrame([None,'string',np.nan,42], index=[0,1,2,3], columns=['A'])

df1 = df['A'].astype(str)
df2 =  df['A'].apply(str)

print df.isnull()
print df1.isnull()
print df2.isnull()

これは to_string() の実装によって修正されると思います

12
Keith

これを使って:

df.column_name = df.column_name.astype( 'str')

1
Faraz Ramtin