辞書検索のPythonリスト

Question

これがあるとします。

[ {"name": "Tom", "age": 10}, {"name": "Mark", "age": 5}, {"name": "Pam", "age": 7} ]

そして名前として "Pam"を検索することによって、私は関連する辞書を検索したいと思います：{name: "Pam", age: 7}

これを達成する方法？

Fr&#233;d&#233;ric Hamidi · Answer

ジェネレータ式：を使うことができます。

>>> dicts = [ ... { "name": "Tom", "age": 10 }, ... { "name": "Mark", "age": 5 }, ... { "name": "Pam", "age": 7 }, ... { "name": "Dick", "age": 12 } ... ] >>> next(item for item in dicts if item["name"] == "Pam") {'age': 7, 'name': 'Pam'}

PaoloC · Answer

これは私にとって最もPythonicな方法です。

people = [ {'name': "Tom", 'age': 10}, {'name': "Mark", 'age': 5}, {'name': "Pam", 'age': 7} ] filter(lambda person: person['name'] == 'Pam', people)

結果（Python 2ではリストとして返されます）：

[{'age': 7, 'name': 'Pam'}]

注：Python 3では、フィルターオブジェクトが返されます。それでpython3解決策はこうなるでしょう：

list(filter(lambda person: person['name'] == 'Pam', people))

Mike N · Answer

@FrédéricHamidiの答えは素晴らしいです。 Python 3.xでは、.next()の構文は少し変更されました。そのため、わずかな修正が必要です。

>>> dicts = [ { "name": "Tom", "age": 10 }, { "name": "Mark", "age": 5 }, { "name": "Pam", "age": 7 }, { "name": "Dick", "age": 12 } ] >>> next(item for item in dicts if item["name"] == "Pam") {'age': 7, 'name': 'Pam'}

@Mattによるコメントで述べたように、デフォルト値を追加することができます。

>>> next((item for item in dicts if item["name"] == "Pam"), False) {'name': 'Pam', 'age': 7} >>> next((item for item in dicts if item["name"] == "Sam"), False) False >>>

user334856 · Answer

リスト内包表記：を使うことができます。

def search(name, people): return [element for element in people if element['name'] == name]

satoru · Answer

people = [ {'name': "Tom", 'age': 10}, {'name': "Mark", 'age': 5}, {'name': "Pam", 'age': 7} ] def search(name): for p in people: if p['name'] == name: return p search("Pam")

user136036 · Answer

辞書のリストをたどり、キーxが特定の値を持つ辞書を返すためにさまざまな方法をテストしました。

結果：

速度：リストの内包>生成式>>通常のリストの繰り返し>>>フィルタ。
すべてのスケールは、リスト内の辞書の数に比例します（リストサイズの10倍 - > 10倍の時間）。
辞書ごとのキーは、大量（数千）のキーに対して速度に大きな影響を与えることはありません。私が計算したこのグラフを見てください： https://imgur.com/a/quQzv （メソッド名は下記参照）。

すべてのテストは Python 3.6 。4、W7x64で行われました。

from random import randint from timeit import timeit list_dicts = [] for _ in range(1000): # number of dicts in the list dict_tmp = {} for i in range(10): # number of keys for each dict dict_tmp[f"key{i}"] = randint(0,50) list_dicts.append( dict_tmp ) def a(): # normal iteration over all elements for dict_ in list_dicts: if dict_["key3"] == 20: pass def b(): # use 'generator' for dict_ in (x for x in list_dicts if x["key3"] == 20): pass def c(): # use 'list' for dict_ in [x for x in list_dicts if x["key3"] == 20]: pass def d(): # use 'filter' for dict_ in filter(lambda x: x['key3'] == 20, list_dicts): pass

結果：

1.7303 # normal list iteration 1.3849 # generator expression 1.3158 # list comprehension 7.7848 # filter

Drazen Urch · Answer

@FrédéricHamidiに少しだけ追加します。

キーが辞書のリストに含まれているかどうかわからない場合は、次のようにすると役立ちます。

next((item for item in dicts if item.get("name") and item["name"] == "Pam"), None)

abby sobh · Answer

あなたはパンダパッケージを試したことがありますか？これはこの種の検索タスクに最適で、最適化されています。

import pandas as pd listOfDicts = [ {"name": "Tom", "age": 10}, {"name": "Mark", "age": 5}, {"name": "Pam", "age": 7} ] # Create a data frame, keys are used as column headers. # Dict items with the same key are entered into the same respective column. df = pd.DataFrame(listOfDicts) # The pandas dataframe allows you to pick out specific values like so: df2 = df[ (df['name'] == 'Pam') & (df['age'] == 7) ] # Alternate syntax, same thing df2 = df[ (df.name == 'Pam') & (df.age == 7) ]

私はパンダのより速い実行時間を大規模に、すなわち100k +エントリで説明するために、以下にベンチマークを少し追加しました。

setup_large = 'dicts = [];\ [dicts.extend(({ "name": "Tom", "age": 10 },{ "name": "Mark", "age": 5 },\ { "name": "Pam", "age": 7 },{ "name": "Dick", "age": 12 })) for _ in range(25000)];\ from operator import itemgetter;import pandas as pd;\ df = pd.DataFrame(dicts);' setup_small = 'dicts = [];\ dicts.extend(({ "name": "Tom", "age": 10 },{ "name": "Mark", "age": 5 },\ { "name": "Pam", "age": 7 },{ "name": "Dick", "age": 12 }));\ from operator import itemgetter;import pandas as pd;\ df = pd.DataFrame(dicts);' method1 = '[item for item in dicts if item["name"] == "Pam"]' method2 = 'df[df["name"] == "Pam"]' import timeit t = timeit.Timer(method1, setup_small) print('Small Method LC: ' + str(t.timeit(100))) t = timeit.Timer(method2, setup_small) print('Small Method Pandas: ' + str(t.timeit(100))) t = timeit.Timer(method1, setup_large) print('Large Method LC: ' + str(t.timeit(100))) t = timeit.Timer(method2, setup_large) print('Large Method Pandas: ' + str(t.timeit(100))) #Small Method LC: 0.000191926956177 #Small Method Pandas: 0.044392824173 #Large Method LC: 1.98827004433 #Large Method Pandas: 0.324505090714

Niclas Nilsson · Answer

names = [{'name':'Tom', 'age': 10}, {'name': 'Mark', 'age': 5}, {'name': 'Pam', 'age': 7}] resultlist = [d for d in names if d.get('name', '') == 'Pam'] first_result = resultlist[0]

これは一方通行です….

ipegasus · Answer

これは辞書のリストから値を検索する一般的な方法です。

def search_dictionaries(key, value, list_of_dictionaries): return [element for element in list_of_dictionaries if element[key] == value]

Jim Dennis · Answer

私が最初に考えたのは、これらの辞書の辞書を作成することを検討したいと思うかもしれません。たとえば、あなたがもっと少ない回数より多くの単語を検索するつもりならば。

しかし、それは時期尚早の最適化かもしれません。何が問題になるでしょう：

def get_records(key, store=dict()): '''Return a list of all records containing name==key from our store ''' assert key is not None return [d for d in store if d['name']==key]

robert king · Answer

dicts=[ {"name": "Tom", "age": 10}, {"name": "Mark", "age": 5}, {"name": "Pam", "age": 7} ] from collections import defaultdict dicts_by_name=defaultdict(list) for d in dicts: dicts_by_name[d['name']]=d print dicts_by_name['Tom'] #output #>>> #{'age': 10, 'name': 'Tom'}

Teoretic · Answer

単純にリスト内包表記を使う：

[i for i in dct if i['name'] == 'Pam'][0]

サンプルコード：

dct = [ {'name': 'Tom', 'age': 10}, {'name': 'Mark', 'age': 5}, {'name': 'Pam', 'age': 7} ] print([i for i in dct if i['name'] == 'Pam'][0]) > {'age': 7, 'name': 'Pam'}

jimifiki · Answer

あなたはリストのすべての要素を通過する必要があります。近道はありません！

どこか他の場所になければ、あなたはリストの項目を指す名前の辞書を保管しますが、それからあなたはあなたのリストから要素をポップすることの結果に注意しなければなりません。

Siddharth Satpathy · Answer

これを試すことができます：

''' lst: list of dictionaries ''' lst = [{"name": "Tom", "age": 10}, {"name": "Mark", "age": 5}, {"name": "Pam", "age": 7}] search = raw_input("What name: ") #Input name that needs to be searched (say 'Pam') print [ lst[i] for i in range(len(lst)) if(lst[i]["name"]==search) ][0] #Output >>> {'age': 7, 'name': 'Pam'}

Doug R. · Answer

同じ質問に対する答えを探していたときに、このスレッドを見つけました。私はそれが遅い答えであることを認識している間、私はそれが他の誰かに役立つならば私はそれを貢献することを考えました：

def find_dict_in_list(dicts, default=None, **kwargs): """Find first matching :obj:`dict` in :obj:`list`. :param list dicts: List of dictionaries. :param dict default: Optional. Default dictionary to return. Defaults to `None`. :param **kwargs: `key=value` pairs to match in :obj:`dict`. :returns: First matching :obj:`dict` from `dicts`. :rtype: dict """ rval = default for d in dicts: is_found = False # Search for keys in dict. for k, v in kwargs.items(): if d.get(k, None) == v: is_found = True else: is_found = False break if is_found: rval = d break return rval if __== '__main__': # Tests dicts = [] keys = 'spam eggs shrubbery knight'.split() start = 0 for _ in range(4): dct = {k: v for k, v in Zip(keys, range(start, start+4))} dicts.append(dct) start += 4 # Find each dict based on 'spam' key only. for x in range(len(dicts)): spam = x*4 assert find_dict_in_list(dicts, spam=spam) == dicts[x] # Find each dict based on 'spam' and 'shrubbery' keys. for x in range(len(dicts)): spam = x*4 assert find_dict_in_list(dicts, spam=spam, shrubbery=spam+2) == dicts[x] # Search for one correct key, one incorrect key: for x in range(len(dicts)): spam = x*4 assert find_dict_in_list(dicts, spam=spam, shrubbery=spam+1) is None # Search for non-existent dict. for x in range(len(dicts)): spam = x+100 assert find_dict_in_list(dicts, spam=spam) is None

lazy_frog · Answer

私はあなたがこれに対処するためにPandasを使うことができると思います。

import pandas as pd person_list = [ {"name": "Tom", "age": 10}, {"name": "Mark", "age": 5}, {"name": "Pam", "age": 7} ] person_df = pd.DataFrame(person_list) person_df[person_df["name"] == "Pam"].to_dict('records')

それは出力します：

[{'age': 7, 'name': 'Pam'}]

利点は次のとおりです。

パンダは高性能のデータ処理を提供します、あなたが大きなデータセットを持っているなら、検索はそれほど多くの時間を消費しないでしょう。
データ構造は使いやすく、データをさらに分析するための表として扱うことができます。

Kőhalmy Zolt&#225;n · Answer

これは、リストの繰り返しではなく、フィルタ+ラムダまたはリファクタリング（必要に応じて、または自分のケースに有効な場合）を使用してコードを辞書の辞書に変換する比較です。

import time # Build list of dicts list_of_dicts = list() for i in range(100000): list_of_dicts.append({'id': i, 'name': 'Tom'}) # Build dict of dicts dict_of_dicts = dict() for i in range(100000): dict_of_dicts[i] = {'name': 'Tom'} # Find the one with ID of 99 # 1. iterate through the list lod_ts = time.time() for elem in list_of_dicts: if elem['id'] == 99999: break lod_tf = time.time() lod_td = lod_tf - lod_ts # 2. Use filter f_ts = time.time() x = filter(lambda k: k['id'] == 99999, list_of_dicts) f_tf = time.time() f_td = f_tf- f_ts # 3. find it in dict of dicts dod_ts = time.time() x = dict_of_dicts[99999] dod_tf = time.time() dod_td = dod_tf - dod_ts print 'List of Dictionries took: %s' % lod_td print 'Using filter took: %s' % f_td print 'Dict of Dicts took: %s' % dod_td

そして出力はこれです：

List of Dictionries took: 0.0099310874939 Using filter took: 0.0121960639954 Dict of Dicts took: 4.05311584473e-06

結論： 明らかに辞書の辞典を持つことは、あなたがidだけで検索すると言っているような場合に検索できるようにするための最も効率的な方法です。興味深いことに、フィルタを使用するのが最も遅い解決策です。