データを上書きせずに既存のExcelファイルに書き込む方法（パンダを使用）？

Question

pandasを使用して、次の方法でExcelファイルに書き込みます。

import pandas writer = pandas.ExcelWriter('Masterfile.xlsx') data_filtered.to_Excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save()

Masterfile.xlsxはすでにいくつかの異なるタブで構成されています。ただし、「メイン」はまだ含まれていません。

パンダは「メイン」シートに正しく書き込みますが、残念ながら他のすべてのタブも削除します。

Ski · Accepted Answer

Pandas docsは、xlsxファイルにopenpyxlを使用すると述べています。 ExcelWriterのコードをざっと見てみると、このようなことがうまくいくかもしれないという手がかりが得られます。

import pandas from openpyxl import load_workbook book = load_workbook('Masterfile.xlsx') writer = pandas.ExcelWriter('Masterfile.xlsx', engine='openpyxl') writer.book = book writer.sheets = dict((ws.title, ws) for ws in book.worksheets) data_filtered.to_Excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save()

MaxU · Answer

ヘルパー関数は次のとおりです。

def append_df_to_Excel(filename, df, sheet_name='Sheet1', startrow=None, truncate_sheet=False, **to_Excel_kwargs): """ Append a DataFrame [df] to existing Excel file [filename] into [sheet_name] Sheet. If [filename] doesn't exist, then this function will create it. Parameters: filename : File path or existing ExcelWriter (Example: '/path/to/file.xlsx') df : dataframe to save to workbook sheet_name : Name of sheet which will contain DataFrame. (default: 'Sheet1') startrow : upper left cell row to dump data frame. Per default (startrow=None) calculate the last row in the existing DF and write to the next row... truncate_sheet : truncate (remove and recreate) [sheet_name] before writing DataFrame to Excel file to_Excel_kwargs : arguments which will be passed to `DataFrame.to_Excel()` [can be dictionary] Returns: None """ from openpyxl import load_workbook import pandas as pd # ignore [engine] parameter if it was passed if 'engine' in to_Excel_kwargs: to_Excel_kwargs.pop('engine') writer = pd.ExcelWriter(filename, engine='openpyxl') # Python 2.x: define [FileNotFoundError] exception if it doesn't exist try: FileNotFoundError except NameError: FileNotFoundError = IOError try: # try to open an existing workbook writer.book = load_workbook(filename) # get the last row in the existing Excel sheet # if it was not specified explicitly if startrow is None and sheet_name in writer.book.sheetnames: startrow = writer.book[sheet_name].max_row # truncate sheet if truncate_sheet and sheet_name in writer.book.sheetnames: # index of [sheet_name] sheet idx = writer.book.sheetnames.index(sheet_name) # remove [sheet_name] writer.book.remove(writer.book.worksheets[idx]) # create an empty sheet [sheet_name] using old index writer.book.create_sheet(sheet_name, idx) # copy existing sheets writer.sheets = {ws.title:ws for ws in writer.book.worksheets} except FileNotFoundError: # file does not exist yet, we will create it pass if startrow is None: startrow = 0 # write out the new sheet df.to_Excel(writer, sheet_name, startrow=startrow, **to_Excel_kwargs) # save the workbook writer.save()

注： Pandas <0.21.0の場合、sheet_nameをsheetnameに置き換えます！

使用例：

append_df_to_Excel('d:/temp/test.xlsx', df) append_df_to_Excel('d:/temp/test.xlsx', df, header=None, index=False) append_df_to_Excel('d:/temp/test.xlsx', df, sheet_name='Sheet2', index=False) append_df_to_Excel('d:/temp/test.xlsx', df, sheet_name='Sheet2', index=False, startrow=25)

mvbentes · Answer

openpyxlversion 2.4.0およびpandasversion 0.19.2を使用すると、@ skiが思いついたプロセスが少し簡単になります。

import pandas from openpyxl import load_workbook with pandas.ExcelWriter('Masterfile.xlsx', engine='openpyxl') as writer: writer.book = load_workbook('Masterfile.xlsx') data_filtered.to_Excel(writer, "Main", cols=['Diff1', 'Diff2']) #That's it!

b2002 · Answer

古い質問ですが、まだこれを探している人がいると思います-だから...

すべてのワークシートが、pandasでsheetname = Noneオプションを使用して作成されたシート名とデータフレームのペアのディクショナリにロードされるため、この方法がいいと思います。ワークシートを追加、削除、または変更するのは簡単です。スプレッドシートをdict形式に読み込んでから、dictから書き戻すまでです。私にとって、xlsxwriterは、速度と形式の点で、この特定のタスクでopenpyxlよりもうまく機能します。

注：pandas（0.21.0+）の将来のバージョンでは、「sheetname」パラメーターが「sheet_name」に変更されます。

# read a single or multi-sheet Excel file # (returns dict of sheetname(s), dataframe(s)) ws_dict = pd.read_Excel(excel_file_path, sheetname=None) # all worksheets are accessible as dataframes. # easy to change a worksheet as a dataframe: mod_df = ws_dict['existing_worksheet'] # do work on mod_df...then reassign ws_dict['existing_worksheet'] = mod_df # add a dataframe to the workbook as a new worksheet with # ws name, df as dict key, value: ws_dict['new_worksheet'] = some_other_dataframe # when done, write dictionary back to Excel... # xlsxwriter honors datetime and date formats # (only included as example)... with pd.ExcelWriter(Excel_file_path, engine='xlsxwriter', datetime_format='yyyy-mm-dd', date_format='yyyy-mm-dd') as writer: for ws_name, df_sheet in ws_dict.items(): df_sheet.to_Excel(writer, sheet_name=ws_name)

2013年の質問の例：

ws_dict = pd.read_Excel('Masterfile.xlsx', sheetname=None) ws_dict['Main'] = data_filtered[['Diff1', 'Diff2']] with pd.ExcelWriter('Masterfile.xlsx', engine='xlsxwriter') as writer: for ws_name, df_sheet in ws_dict.items(): df_sheet.to_Excel(writer, sheet_name=ws_name)

Will Ayd · Answer

pandas 0.24以降では、modeのExcelWriterキーワード引数を使用してこれを簡素化できます。

import pandas as pd with pd.ExcelWriter('the_file.xlsx', engine='openpyxl', mode='a') as writer: data_filtered.to_Excel(writer)

flyingmeatball · Answer

私はこれが古いスレッドであることを知っていますが、これは検索時に最初に見つける項目であり、既に作成したワークブックにチャートを保持する必要がある場合、上記のソリューションは機能しません。その場合、xlwingsはより良いオプションです。Excelブックに書き込むことができ、チャート/チャートデータを保持できます。

簡単な例：

import xlwings as xw import pandas as pd #create DF months = ['2017-01','2017-02','2017-03','2017-04','2017-05','2017-06','2017-07','2017-08','2017-09','2017-10','2017-11','2017-12'] value1 = [x * 5+5 for x in range(len(months))] df = pd.DataFrame(value1, index = months, columns = ['value1']) df['value2'] = df['value1']+5 df['value3'] = df['value2']+5 #load workbook that has a chart in it wb = xw.Book('C:\data\bookwithChart.xlsx') ws = wb.sheets['chartData'] ws.range('A1').options(index=False).value = df wb = xw.Book('C:\data\bookwithChart_updated.xlsx') xw.apps[0].quit()

blacksheep · Answer

pandas 0.24にはより良い解決策があります：

with pd.ExcelWriter(path, mode='a') as writer: s.to_Excel(writer, sheet_name='another sheet', index=False)

前：

後：

pandasを今すぐアップグレードしてください：

pip install --upgrade pandas

Manish Mehra · Answer

def append_sheet_to_master(self, master_file_path, current_file_path, sheet_name): try: master_book = load_workbook(master_file_path) master_writer = pandas.ExcelWriter(master_file_path, engine='openpyxl') master_writer.book = master_book master_writer.sheets = dict((ws.title, ws) for ws in master_book.worksheets) current_frames = pandas.ExcelFile(current_file_path).parse(pandas.ExcelFile(current_file_path).sheet_names[0], header=None, index_col=None) current_frames.to_Excel(master_writer, sheet_name, index=None, header=False) master_writer.save() except Exception as e: raise e

これは、マスターファイル（新しいシートを追加するファイル）のフォーマットが失われるということだけが完全にうまくいきます。

Pedro Machado · Answer

book = load_workbook(xlsFilename) writer = pd.ExcelWriter(self.xlsFilename) writer.book = book writer.sheets = dict((ws.title, ws) for ws in book.worksheets) df.to_Excel(writer, sheet_name=sheetName, index=False) writer.save()

Edward · Answer

writer = pd.ExcelWriter('prueba1.xlsx'engine='openpyxl',keep_date_col=True)

「keep_date_col」の希望はあなたを助ける