sqlalchemyを使用してCSVをデータベースにインポートする

Question

私は this の例を使用して、csvファイルをsqliteデータベースにアップロードします。

これは私のコードです：

from numpy import genfromtxt from time import time from datetime import datetime from sqlalchemy import Column, Integer, Float, Date, String, VARCHAR from sqlalchemy.ext.declarative import declarative_base from sqlalchemy import create_engine from sqlalchemy.orm import sessionmaker def Load_Data(file_name): data = genfromtxt(file_name, delimiter=',')# skiprows=1, converters={0: lambda s: str(s)}) return data.tolist() Base = declarative_base() class cdb1(Base): #Tell SQLAlchemy what the table name is and if there's any table-specific arguments it should know about __tablename__ = 'cdb1' __table_args__ = {'sqlite_autoincrement': True} #tell SQLAlchemy the name of column and its attributes: id = Column(Integer, primary_key=True, nullable=False) name = Column(VARCHAR(40)) shack = Column(VARCHAR) db = Column(Integer) payments = Column(Integer) status = Column(VARCHAR) if __name__ == "__main__": t = time() print 'creating database' #Create the database engine = create_engine('sqlite:///cdb.db') Base.metadata.create_all(engine) #Create the session session = sessionmaker() session.configure(bind=engine) s = session() try: file_name = 'client_db.csv' data = Load_Data(file_name) for i in data: record = cdb1(**{ 'name' : i[0], 'shack' : i[1], 'db' : i[2], 'payments' : i[3], 'status' : i[4] }) s.add(record) #Add all the records s.commit() #Attempt to commit all the records except: s.rollback() #Rollback the changes on error print 'error in reading' finally: s.close() #Close the connection print "Time elapsed: " + str(time() - t) + " s." #0.091s

そして、これはcsvファイルの最初の数行です：

Name,Shack,DB,Payments,Status Loyiso Dwala,I156,13542,37,LightsOnly ON Attwell Fayo,I157,13077,32,LightsON David Mbhele,G25,13155,33,LightsON

DBは正常に作成されますが、一部のデータのみが属性に取り込まれます。「payments」列と「db」列は正しく入力されていますが、その他はすべてNULLとして出力されます。

更新された正しいコード（pandasデータフレームを使用）：

from numpy import genfromtxt from time import time from datetime import datetime from sqlalchemy import Column, Integer, Float, Date, String, VARCHAR from sqlalchemy.ext.declarative import declarative_base from sqlalchemy import create_engine from sqlalchemy.orm import sessionmaker import csv import pandas as pd #def Load_Data(file_name): #data = csv.reader(file_name, delimiter=',')# skiprows=1, converters={0: lambda s: str(s)}) #return data.tolist() Base = declarative_base() class cdb1(Base): #Tell SQLAlchemy what the table name is and if there's any table-specific arguments it should know about __tablename__ = 'cdb1' __table_args__ = {'sqlite_autoincrement': True} #tell SQLAlchemy the name of column and its attributes: id = Column(Integer, primary_key=True, nullable=False) Name = Column(VARCHAR(40)) Shack = Column(VARCHAR) DB = Column(Integer) Payments = Column(Integer) Status = Column(VARCHAR) engine = create_engine('sqlite:///cdb.db') Base.metadata.create_all(engine) file_name = 'client_db.csv' df = pd.read_csv(file_name) df.to_sql(con=engine, index_label='id', name=cdb1.__tablename__, if_exists='replace')

Brailo · Accepted Answer

Pandas Dataframeに精通していますか？

使用（およびデバッグ）が本当に簡単

pandas.read_csv（file_name）

In [5]: pandas.read_csv('/tmp/csvt.csv') Out[5]: Name Shack DB Payments Status 0 Loyiso Dwala I156 13542 37 LightsOnly ON 1 Attwell Fayo I157 13077 32 LightsON 2 David Mbhele G25 13155 33 LightsON

DataFramesデータをテーブルに挿入するには、単純に pandas.DataFrame.to_sql を使用できます

したがって、メインコードは次のようになります。

engine = create_engine('sqlite:///cdb.db') Base.metadata.create_all(engine) file_name = 'client_db.csv' df = pandas.read_csv(file_name) df.to_sql(con=engine, index_label='id', name=cdb1.__tablename__, if_exists='replace')

追加したドキュメントリンクをさらに読み、目的に合わせて関数Parametersを設定する必要があります（特に-if_exists、index、index_label、dtypeを見てください）。