read_csv
をdtype={n: pandas.Categorical}
としてdtype
パラメータを渡してみましたが、これは正しく機能しません(結果はオブジェクトです)。 マニュアルは不明確 。
バージョン 0.19.0
dtype='category'
でパラメータread_csv
を使用できます:
data = 'col1,col2,col3\na,b,1\na,b,2\nc,d,3'
df = pd.read_csv(pd.compat.StringIO(data), dtype='category')
print (df)
col1 col2 col3
0 a b 1
1 a b 2
2 c d 3
print (df.dtypes)
col1 category
col2 category
col3 category
dtype: object
カテゴリの列を指定する場合は、辞書でdtype
を使用します。
df = pd.read_csv(pd.compat.StringIO(data), dtype={'col1':'category'})
print (df)
col1 col2 col3
0 a b 1
1 a b 2
2 c d 3
print (df.dtypes)
col1 category
col2 object
col3 int64
dtype: object
カテゴリーは有効ではありません dtype 。
この StackOverflow post には、カテゴリデータをテキストファイルに保存する方法の詳細が含まれています。