次のコードを使用して、.xlsxファイルを.csvファイルに変換しています。
import pandas as pd
data_xls = pd.read_Excel('excelfile.xlsx', 'Sheet2', index_col=None)
data_xls.to_csv('csvfile.csv', encoding='utf-8')
コードは機能していますが、不要なセル番号を含むインデックス列を取得しています。とにかくそのインデックス列を含めたり削除したりしないことはありますか?
ファイル出力
Unnamed Data
0 0.99319613
1 0.99319613
2 0.99319613
3 0.99319613
4 0.99319613
5 0.99319613
DataFrame.to_csv()
のドキュメントに記載されているように、単にindex=False
行名を書き込まないキーワード引数として。
data_xls.to_csv('csvfile.csv', encoding='utf-8', index=False)
列名を削除するには:
data_xls.to_csv("filename.csv",index=False,header=None ,encoding='utf-8')
Miraduloに触発され、数値変換の問題を修正します。
import pandas as pd
data_xls = pd.read_Excel('excelfile.xlsx', 'Sheet2', dtype=str, index_col=None)
data_xls.to_csv('csvfile.csv', encoding='utf-8', index=False)
シートが1枚の場合、「Sheet2」をドロップできます。数値変換を回避するためのdtype = str。