私は次の関数を使用して、Oracleからデータをフェッチするための「より読みやすい」(おそらく)形式を作成しています。関数は次のとおりです。
def rows_to_dict_list(cursor):
"""
Create a list, each item contains a dictionary outlined like so:
{ "col1_name" : col1_data }
Each item in the list is technically one row of data with named columns,
represented as a dictionary object
For example:
list = [
{"col1":1234567, "col2":1234, "col3":123456, "col4":BLAH},
{"col1":7654321, "col2":1234, "col3":123456, "col4":BLAH}
]
"""
# Get all the column names of the query.
# Each column name corresponds to the row index
#
# cursor.description returns a list of tuples,
# with the 0th item in the Tuple being the actual column name.
# everything after i[0] is just misc Oracle info (e.g. datatype, size)
columns = [i[0] for i in cursor.description]
new_list = []
for row in cursor:
row_dict = dict()
for col in columns:
# Create a new dictionary with field names as the key,
# row data as the value.
#
# Then add this dictionary to the new_list
row_dict[col] = row[columns.index(col)]
new_list.append(row_dict)
return new_list
次に、次のような関数を使用します。
sql = "Some kind of SQL statement"
curs.execute(sql)
data = rows_to_dict_list(curs)
#
for row in data:
item1 = row["col1"]
item2 = row["col2"]
# Do stuff with item1, item2, etc...
# You don't necessarily have to assign them to variables,
# but you get the idea.
これはさまざまなレベルのストレスの下でかなりうまく機能しているように見えますが、これを行うためのより効率的な、または「Pythonic」な方法があるかどうか疑問に思っています。
他にも改善すべき点がありますが、これは本当に私に飛びつきました。
for col in columns:
# Create a new dictionary with field names as the key,
# row data as the value.
#
# Then add this dictionary to the new_list
row_dict[col] = row[columns.index(col)]
非効率的であることに加えて、このような状況でindex
を使用すると、少なくとも同じアイテムがリストに2回出現する可能性がある状況では、バグが発生しやすくなります。代わりにenumerate
を使用してください。
for i, col in enumerate(columns):
# Create a new dictionary with field names as the key,
# row data as the value.
#
# Then add this dictionary to the new_list
row_dict[col] = row[i]
しかし、それは本当に小さなジャガイモです。この関数のはるかにコンパクトなバージョンは次のとおりです。
def rows_to_dict_list(cursor):
columns = [i[0] for i in cursor.description]
return [dict(Zip(columns, row)) for row in cursor]
それがうまくいくかどうか教えてください。
リスト内のすべてを事前にダンプすることによるメモリ使用量を回避するためのクリーンな方法として、カーソルをジェネレーター関数でラップすることができます。
def rows_as_dicts(cursor):
""" returns cx_Oracle rows as dicts """
colnames = [i[0] for i in cursor.description]
for row in cursor:
yield dict(Zip(colnames, row))
次に、次のように使用します。カーソルからの行は、反復中にdictに変換されます。
for row in rows_as_dicts(cursor):
item1 = row["col1"]
item2 = row["col2"]
メモリ使用量が膨大になるため、大きな結果セットにdictを使用しないでください。私はcx_Oracleをよく使用しますが、そのためのモジュールを作成するのに十分なニース辞書カーソルがありません。また、Pythonをさまざまなデータベースに接続する必要があるため、任意のDB API2コネクタで使用できる方法で接続しました。
それはPyPiにあります DBMS-データベースがよりシンプルになりました
>>> import dbms
>>> db = dbms.OraConnect('myUser', 'myPass', 'myInstance')
>>> cur = db.cursor()
>>> cur.execute('SELECT * FROM people WHERE id = :id', {'id': 1123})
>>> row = cur.fetchone()
>>> row['last_name']
Bailey
>>> row.last_name
Bailey
>>> row[3]
Bailey
>>> row[0:4]
[1123, 'Scott', 'R', 'Bailey']
カーソル「カーソル」がすでに定義されており、移動するのはまれであると想定します。
byCol = {cl:i for i,(cl,type, a, b, c,d,e) in enumerate(Cursor.description)}
その後、あなたはただ行くことができます:
for row in Cursor: column_of_interest = row[byCol["COLUMN_NAME_OF_INTEREST"]]
システムがそれ自体を処理するほどクリーンでスムーズではありませんが、恐ろしいことではありません。
Dictを作成する
cols=dict()
for col, desc in enumerate(cur.description):
cols[desc[0]] = col
アクセスするために:
for result in cur
print (result[cols['COL_NAME']])
私はより良いものを持っています:
import cx_Oracle
def makedict(cursor):
"""Convert cx_Oracle query result to be a dictionary
"""
cols = [d[0] for d in cursor.description]
def createrow(*args):
return dict(Zip(cols, args))
return createrow
db = cx_Oracle.connect('user', 'pw', 'Host')
cursor = db.cursor()
rs = cursor.execute('SELECT * FROM Tablename')
cursor.rowfactory = makedict(cursor)