web-dev-qa-db-ja.com

Python辞書オブジェクトからキーと値のペアのサブセットを抽出しますか?

私はいくつかのキーと値のペア(約16)を持つ大きな辞書オブジェクトを持っていますが、私はそのうち3つにしか興味がありません。それを達成するための最善の方法(最短/効率/最上級)は何ですか?

私が知っている最高のものは:

bigdict = {'a':1,'b':2,....,'z':26} 
subdict = {'l':bigdict['l'], 'm':bigdict['m'], 'n':bigdict['n']}

私はこれよりもっとエレガントな方法があると確信しています。アイデア?

254
Jayesh

あなたが試すことができます:

dict((k, bigdict[k]) for k in ('l', 'm', 'n'))

...または Python 3 Pythonバージョン2.7以降(それは2.7でも動作することを指摘してくれた FábioDiniz に感謝します)

{k: bigdict[k] for k in ('l', 'm', 'n')}

更新: HåvardS が指摘するように、私はあなたがキーを辞書に入れるつもりであることを知っていると思います - 参照してください 彼の答え =その仮定ができない場合あるいは、 timbo がコメントで指摘しているように、bigdictに欠けているキーをNoneにマッピングするには、次のようにします。

{k: bigdict.get(k, None) for k in ('l', 'm', 'n')}

Python 3を使用していて、のみ、元の辞書に実際に存在する新しい辞書のキーが必要な場合は、ビューオブジェクトはいくつかの集合演算を実装します。

{k: bigdict[k] for k in bigdict.keys() & {'l', 'm', 'n'}}
353
Mark Longair

少々短い、少なくとも:

wanted_keys = ['l', 'm', 'n'] # The keys you want
dict((k, bigdict[k]) for k in wanted_keys if k in bigdict)
99
Håvard S
interesting_keys = ('l', 'm', 'n')
subdict = {x: bigdict[x] for x in interesting_keys if x in bigdict}
20
theheadofabroom

上記のすべての方法について、少し速度を比較してみましょう。

Python 2.7.11 |Anaconda 2.4.1 (64-bit)| (default, Jan 29 2016, 14:26:21) [MSC v.1500 64 bit (AMD64)] on win32
In[2]: import numpy.random as nprnd
keys = nprnd.randint(1000, size=10000)
bigdict = dict([(_, nprnd.Rand()) for _ in range(1000)])

%timeit {key:bigdict[key] for key in keys}
%timeit dict((key, bigdict[key]) for key in keys)
%timeit dict(map(lambda k: (k, bigdict[k]), keys))
%timeit dict(filter(lambda i:i[0] in keys, bigdict.items()))
%timeit {key:value for key, value in bigdict.items() if key in keys}
100 loops, best of 3: 3.09 ms per loop
100 loops, best of 3: 3.72 ms per loop
100 loops, best of 3: 6.63 ms per loop
10 loops, best of 3: 20.3 ms per loop
100 loops, best of 3: 20.6 ms per loop

予想通り、辞書の内包表記が最善の選択肢です。

12
Sklavit

この答えは選択された答えに似た辞書内包表記を使いますが、欠けている項目を除いてはそうではありません。

python 2バージョン:

{k:v for k, v in bigDict.iteritems() if k in ('l', 'm', 'n')}

python 3バージョン:

{k:v for k, v in bigDict.items() if k in ('l', 'm', 'n')}
11
Meow

多分:

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n']])

Python 3はさらに以下をサポートします。

subdict={a:bigdict[a] for a in ['l','m','n']}

次のようにして辞書の存在を確認できます。

subdict=dict([(x,bigdict[x]) for x in ['l', 'm', 'n'] if x in bigdict])

それぞれ。 Python 3用

subdict={a:bigdict[a] for a in ['l','m','n'] if a in bigdict}
4
phimuemue

さて、これは私を数回悩ませているものですので、それを尋ねてくれてありがとうJayesh。

上記の答えは、これと同じくらい良い解決策のように思えますが、あなたがあなたのコード全体でこれを使用している場合、それは機能の私見をラップすることは理にかなっています。また、ここでは2つの使用例が考えられます。1つは、すべてのキーワードが元の辞書にあるかどうかを気にする場合です。そしてあなたがいないところ。両方を平等に扱うことはいいことです。

それで、私の2分の1の価値のために、私は辞書のサブクラスを書くことを提案します。

class my_dict(dict):
    def subdict(self, keywords, fragile=False):
        d = {}
        for k in keywords:
            try:
                d[k] = self[k]
            except KeyError:
                if fragile:
                    raise
        return d

これでサブ辞書を引き出すことができます

orig_dict.subdict(keywords)

使用例

#
## our keywords are letters of the alphabet
keywords = 'abcdefghijklmnopqrstuvwxyz'
#
## our dictionary maps letters to their index
d = my_dict([(k,i) for i,k in enumerate(keywords)])
print('Original dictionary:\n%r\n\n' % (d,))
#
## constructing a sub-dictionary with good keywords
oddkeywords = keywords[::2]
subd = d.subdict(oddkeywords)
print('Dictionary from odd numbered keys:\n%r\n\n' % (subd,))
#
## constructing a sub-dictionary with mixture of good and bad keywords
somebadkeywords = keywords[1::2] + 'A'
try:
    subd2 = d.subdict(somebadkeywords)
    print("We shouldn't see this message")
except KeyError:
    print("subd2 construction fails:")
    print("\toriginal dictionary doesn't contain some keys\n\n")
#
## Trying again with fragile set to false
try:
    subd3 = d.subdict(somebadkeywords, fragile=False)
    print('Dictionary constructed using some bad keys:\n%r\n\n' % (subd3,))
except KeyError:
    print("We shouldn't see this message")

上記のすべてのコードを実行すると、次のような出力が表示されるはずです(フォーマットがすみません)。

オリジナル辞書
{'a':0、 'c':2、 'b':1、 'e':4、 'd':3、 'g':6、 'f':5、 'i ':8、' h ':7、' k ':10、' j ':9、' m ':12、' l ':11、' o ':14、' n ':13、' q ': 16、「p」:15、「s」:18、「r」:17、「u」:20、「t」:19、「w」:22、「v」:21、「y」:24、 'x':23、 'z':25}

奇数番号のキーからの辞書:
{'a':0、 'c':2、 'e':4、 'g':6、 'i':8、 'k':10、 'm':12、 'o ':14、' q ':16、' s ':18、' u ':20、' w ':22、' y ':24}

subd2構築は失敗します:
オリジナル辞書にはキーが含まれていません

いくつかの悪いキーを使って構築された辞書:
{'b':1、 'd':3、 'f':5、 'h':7、 'j':9、 'l':11、 'n':13、 'p ':15、' r ':17、' t ':19、' v ':21、' x ':23、' z ':25}

3
pandamonium

Mapを使うこともできます(これは非常にとにかく知るための便利な関数です)。

sd = dict(map(lambda k: (k, l.get(k, None)), l))

例:

large_dictionary = {'a1':123, 'a2':45, 'a3':344} list_of_keys = ['a1', 'a3'] small_dictionary = dict(map(lambda key: (key, large_dictionary.get(key, None)), list_of_keys))

PS。前回の回答から.get(key、None)を借りました。

3
halfdanrump

さらにもう一つ(私はMark Longairの答えを好む)

di = {'a':1,'b':2,'c':3}
req = ['a','c','w']
dict([i for i in di.iteritems() if i[0] in di and i[0] in req])
1
georg