たとえば、24個の青いバナナ、12個の青リンゴ、0個の青いイチゴなど、さまざまな色の果物がたくさんあるとします。選択とソートを簡単に行えるPythonのデータ構造に整理したいと思います。私のアイデアは、タプルをキーとして辞書に入れることでした。
{ ('banana', 'blue' ): 24,
('Apple', 'green'): 12,
('strawberry','blue' ): 0,
...
}
または辞書さえも、例えば
{ {'fruit': 'banana', 'color': 'blue' }: 24,
{'fruit': 'Apple', 'color': 'green'}: 12,
{'fruit': 'strawberry','color': 'blue' }: 0,
...
}
たとえば、すべての青い果物のリスト、またはすべての色のバナナのリストを取得したり、果物の名前でこの辞書を並べ替えたいと思います。これをきれいに行う方法はありますか?
タプルをキーとして持つ辞書は、この状況を処理するproperの方法ではないかもしれません。
すべての提案を歓迎します!
個人的に、pythonで気に入っているものの1つは、Tuple-dictの組み合わせです。ここにあるのは事実上2D配列(ここでx =フルーツ名とy =色)であり、少なくともnumpy
またはデータベースのような場合、2D配列を実装するためのタプルの辞書の支持者です。より適切ではありません。要するに、あなたは良いアプローチを持っていると思います。
追加の作業を行わない限り、dictのキーとしてdictを使用できないため、あまり良い解決策ではないことに注意してください。
ただし、 namedtuple() も考慮する必要があります。その方法でこれを行うことができます:
>>> from collections import namedtuple
>>> Fruit = namedtuple("Fruit", ["name", "color"])
>>> f = Fruit(name="banana", color="red")
>>> print f
Fruit(name='banana', color='red')
>>> f.name
'banana'
>>> f.color
'red'
これで、fruitcount dictを使用できます。
>>> fruitcount = {Fruit("banana", "red"):5}
>>> fruitcount[f]
5
その他のトリック:
>>> fruits = fruitcount.keys()
>>> fruits.sort()
>>> print fruits
[Fruit(name='Apple', color='green'),
Fruit(name='Apple', color='red'),
Fruit(name='banana', color='blue'),
Fruit(name='strawberry', color='blue')]
>>> fruits.sort(key=lambda x:x.color)
>>> print fruits
[Fruit(name='banana', color='blue'),
Fruit(name='strawberry', color='blue'),
Fruit(name='Apple', color='green'),
Fruit(name='Apple', color='red')]
Chmulligをエコーして、1つの果物のすべての色のリストを取得するには、キーをフィルタリングする必要があります。
bananas = [fruit for fruit in fruits if fruit.name=='banana']
最適なオプションは、シンプルなデータ構造を作成して、所有しているものをモデル化することです。次に、これらのオブジェクトを単純なリストに保存し、任意の方法でソート/取得できます。
この場合、次のクラスを使用します。
class Fruit:
def __init__(self, name, color, quantity):
self.name = name
self.color = color
self.quantity = quantity
def __str__(self):
return "Name: %s, Color: %s, Quantity: %s" % \
(self.name, self.color, self.quantity)
その後、次の方法で示すように、単に「フルーツ」インスタンスを構築してリストに追加できます。
fruit1 = Fruit("Apple", "red", 12)
fruit2 = Fruit("pear", "green", 22)
fruit3 = Fruit("banana", "yellow", 32)
fruits = [fruit3, fruit2, fruit1]
単純なリストfruits
は、はるかに簡単で、混乱が少なく、保守が容易です。
使用例:
以下のすべての出力は、次のコードスニペットを実行した後の結果です。
for fruit in fruits:
print fruit
未分類リスト:
ディスプレイ:
Name: banana, Color: yellow, Quantity: 32
Name: pear, Color: green, Quantity: 22
Name: Apple, Color: red, Quantity: 12
名前のアルファベット順にソート:
fruits.sort(key=lambda x: x.name.lower())
ディスプレイ:
Name: Apple, Color: red, Quantity: 12
Name: banana, Color: yellow, Quantity: 32
Name: pear, Color: green, Quantity: 22
数量でソート:
fruits.sort(key=lambda x: x.quantity)
ディスプレイ:
Name: Apple, Color: red, Quantity: 12
Name: pear, Color: green, Quantity: 22
Name: banana, Color: yellow, Quantity: 32
色==赤:
red_fruit = filter(lambda f: f.color == "red", fruits)
ディスプレイ:
Name: Apple, Color: red, Quantity: 12
データベース、辞書の辞書、辞書のリストの辞書、Tuple(サブクラス)、sqlite、冗長性という名前...私は自分の目を信じていませんでした。ほかに何か ?
「キーとしてタプルを使用する辞書は、この状況を処理する適切な方法ではない可能性があります。」
「私の直感では、データベースはOPのニーズを超えていると感じています。」
うん!思った
だから、私の意見では、タプルのリストで十分です:
from operator import itemgetter
li = [ ('banana', 'blue' , 24) ,
('Apple', 'green' , 12) ,
('strawberry', 'blue' , 16 ) ,
('banana', 'yellow' , 13) ,
('Apple', 'gold' , 3 ) ,
('pear', 'yellow' , 10) ,
('strawberry', 'orange' , 27) ,
('Apple', 'blue' , 21) ,
('Apple', 'silver' , 0 ) ,
('strawberry', 'green' , 4 ) ,
('banana', 'brown' , 14) ,
('strawberry', 'yellow' , 31) ,
('Apple', 'pink' , 9 ) ,
('strawberry', 'gold' , 0 ) ,
('pear', 'gold' , 66) ,
('Apple', 'yellow' , 9 ) ,
('pear', 'brown' , 5 ) ,
('strawberry', 'pink' , 8 ) ,
('Apple', 'purple' , 7 ) ,
('pear', 'blue' , 51) ,
('chesnut', 'yellow', 0 ) ]
print set( u[1] for u in li ),': all potential colors'
print set( c for f,c,n in li if n!=0),': all effective colors'
print [ c for f,c,n in li if f=='banana' ],': all potential colors of bananas'
print [ c for f,c,n in li if f=='banana' and n!=0],': all effective colors of bananas'
print
print set( u[0] for u in li ),': all potential fruits'
print set( f for f,c,n in li if n!=0),': all effective fruits'
print [ f for f,c,n in li if c=='yellow' ],': all potential fruits being yellow'
print [ f for f,c,n in li if c=='yellow' and n!=0],': all effective fruits being yellow'
print
print len(set( u[1] for u in li )),': number of all potential colors'
print len(set(c for f,c,n in li if n!=0)),': number of all effective colors'
print len( [c for f,c,n in li if f=='strawberry']),': number of potential colors of strawberry'
print len( [c for f,c,n in li if f=='strawberry' and n!=0]),': number of effective colors of strawberry'
print
# sorting li by name of fruit
print sorted(li),' sorted li by name of fruit'
print
# sorting li by number
print sorted(li, key = itemgetter(2)),' sorted li by number'
print
# sorting li first by name of color and secondly by name of fruit
print sorted(li, key = itemgetter(1,0)),' sorted li first by name of color and secondly by name of fruit'
print
結果
set(['blue', 'brown', 'gold', 'purple', 'yellow', 'pink', 'green', 'orange', 'silver']) : all potential colors
set(['blue', 'brown', 'gold', 'purple', 'yellow', 'pink', 'green', 'orange']) : all effective colors
['blue', 'yellow', 'brown'] : all potential colors of bananas
['blue', 'yellow', 'brown'] : all effective colors of bananas
set(['strawberry', 'chesnut', 'pear', 'banana', 'Apple']) : all potential fruits
set(['strawberry', 'pear', 'banana', 'Apple']) : all effective fruits
['banana', 'pear', 'strawberry', 'Apple', 'chesnut'] : all potential fruits being yellow
['banana', 'pear', 'strawberry', 'Apple'] : all effective fruits being yellow
9 : number of all potential colors
8 : number of all effective colors
6 : number of potential colors of strawberry
5 : number of effective colors of strawberry
[('Apple', 'blue', 21), ('Apple', 'gold', 3), ('Apple', 'green', 12), ('Apple', 'pink', 9), ('Apple', 'purple', 7), ('Apple', 'silver', 0), ('Apple', 'yellow', 9), ('banana', 'blue', 24), ('banana', 'brown', 14), ('banana', 'yellow', 13), ('chesnut', 'yellow', 0), ('pear', 'blue', 51), ('pear', 'brown', 5), ('pear', 'gold', 66), ('pear', 'yellow', 10), ('strawberry', 'blue', 16), ('strawberry', 'gold', 0), ('strawberry', 'green', 4), ('strawberry', 'orange', 27), ('strawberry', 'pink', 8), ('strawberry', 'yellow', 31)] sorted li by name of fruit
[('Apple', 'silver', 0), ('strawberry', 'gold', 0), ('chesnut', 'yellow', 0), ('Apple', 'gold', 3), ('strawberry', 'green', 4), ('pear', 'brown', 5), ('Apple', 'purple', 7), ('strawberry', 'pink', 8), ('Apple', 'pink', 9), ('Apple', 'yellow', 9), ('pear', 'yellow', 10), ('Apple', 'green', 12), ('banana', 'yellow', 13), ('banana', 'brown', 14), ('strawberry', 'blue', 16), ('Apple', 'blue', 21), ('banana', 'blue', 24), ('strawberry', 'orange', 27), ('strawberry', 'yellow', 31), ('pear', 'blue', 51), ('pear', 'gold', 66)] sorted li by number
[('Apple', 'blue', 21), ('banana', 'blue', 24), ('pear', 'blue', 51), ('strawberry', 'blue', 16), ('banana', 'brown', 14), ('pear', 'brown', 5), ('Apple', 'gold', 3), ('pear', 'gold', 66), ('strawberry', 'gold', 0), ('Apple', 'green', 12), ('strawberry', 'green', 4), ('strawberry', 'orange', 27), ('Apple', 'pink', 9), ('strawberry', 'pink', 8), ('Apple', 'purple', 7), ('Apple', 'silver', 0), ('Apple', 'yellow', 9), ('banana', 'yellow', 13), ('chesnut', 'yellow', 0), ('pear', 'yellow', 10), ('strawberry', 'yellow', 31)] sorted li first by name of color and secondly by name of fruit
この場合、辞書はおそらく使用すべきものではありません。より完全な機能を備えたライブラリがより良い代替手段になります。おそらく実際のデータベース。最も簡単なのは sqlite です。ファイル名の代わりに文字列「:memory:」を渡すことで、すべてをメモリに保存できます。
このパスを続けたい場合は、キーまたは値の追加の属性を使用して実行できます。ただし、辞書を別の辞書のキーにすることはできませんが、タプルはできます。 ドキュメント 許可される内容を説明します。これは、文字列、数字、および文字列と数字のみを含むタプル(およびこれらの型のみを再帰的に含むタプルを含む)を含む不変オブジェクトでなければなりません。
d = {('Apple', 'red') : 4}
を使用して最初の例を実行できますが、必要なものを照会するのは非常に困難です。次のようなことをする必要があります。
#find all apples
apples = [d[key] for key in d.keys() if key[0] == 'Apple']
#find all red items
red = [d[key] for key in d.keys() if key[1] == 'red']
#the red Apple
redapples = d[('Apple', 'red')]
キーをタプルとして、指定された2番目のコンポーネントでキーをフィルタリングし、ソートするだけです。
blue_fruit = sorted([k for k in data.keys() if k[1] == 'blue'])
for k in blue_fruit:
print k[0], data[k] # prints 'banana 24', etc
ソートが機能するのは、そのコンポーネントに自然順序がある場合、タプルに自然順序があるためです。
キーをかなり本格的なオブジェクトとして使用すると、k.color == 'blue'
でフィルタリングできます。
Dictをキーとして実際に使用することはできませんが、class Foo(object): pass
のような最も単純なクラスを作成し、その属性をその場で追加できます。
k = Foo()
k.color = 'blue'
これらのインスタンスはdictキーとして機能しますが、それらの可変性に注意してください!
エントリが他の辞書のリストである辞書を作成できます。
fruit_dict = dict()
fruit_dict['banana'] = [{'yellow': 24}]
fruit_dict['Apple'] = [{'red': 12}, {'green': 14}]
print fruit_dict
出力:
{'banana':[{'yellow':24}]、 'Apple':[{'red':12}、{'green':14}]}
編集:eumiroが指摘したように、辞書の辞書を使用できます:
fruit_dict = dict()
fruit_dict['banana'] = {'yellow': 24}
fruit_dict['Apple'] = {'red': 12, 'green': 14}
print fruit_dict
出力:
{'banana':{'yellow':24}、 'Apple':{'green':14、 'red':12}}
2つのキーを個別に使用するため、2つの選択肢があります。
{'banana' : {'blue' : 4, ...}, .... }
および{'blue': {'banana':4, ...} ...}
の2つの辞書でデータを冗長に保存します。次に、検索と並べ替えは簡単ですが、辞書を一緒に修正する必要があります。
それをただ一つの辞書に保存し、次にそれらを反復する関数を書きます。例えば:
d = {'banana' : {'blue' : 4, 'yellow':6}, 'Apple':{'red':1} }
blueFruit = [(fruit,d[fruit]['blue']) if d[fruit].has_key('blue') for fruit in d.keys()]
このタイプのデータは、トライのようなデータ構造から効率的に取得されます。また、高速ソートが可能になります。ただし、メモリ効率はそれほど高くないかもしれません。
従来のトライでは、Wordの各文字をツリーのノードとして保存します。しかし、あなたの場合、「アルファベット」は異なります。文字ではなく文字列を保存しています。
次のようになります。
root: Root
/|\
/ | \
/ | \
fruit: Banana Apple Strawberry
/ | | \
/ | | \
color: Blue Yellow Green Blue
/ | | \
/ | | \
end: 24 100 12 0
このリンクを参照してください: Pythonのトライ