web-dev-qa-db-ja.com

Daskデータフレームを使用して列を削除する

これは機能するはずです:

raw_data.drop('some_great_column', axis=1).compute(

ただし、列は削除されません。 pandas私が使用するもの:

raw_data.drop(['some_great_column'], axis=1, inplace=True)

しかし、インプレースはDaskには存在しません。何か案は?

5
cs0815

次の2つの操作に分けることができます。

# dask operation
raw_data = raw_data.drop('some_great_column', axis=1)

# conversion to pandas
df = raw_data.compute()

次に、PandasデータフレームをCSVファイルにエクスポートします:

df.to_csv(r'out.csv', index=False)
4
jpp