web-dev-qa-db-ja.com

値によるグループリスト

次のようなリストがあるとしましょう:

list = [["A",0], ["B",1], ["C",0], ["D",2], ["E",2]]

これを最もエレガントにグループ化して、Pythonでこのリスト出力を取得するにはどうすればよいですか?

list = [["A", "C"], ["B"], ["D", "E"]]

したがって、値は秒の値でグループ化されますが、順序は保持されます...

50
Veles
values = set(map(lambda x:x[1], list))
newlist = [[y[0] for y in list if y[1]==x] for x in values]
81
Howard
from operator import itemgetter
from itertools import groupby

lki = [["A",0], ["B",1], ["C",0], ["D",2], ["E",2]]
lki.sort(key=itemgetter(1))

glo = [[x for x,y in g]
       for k,g in  groupby(lki,key=itemgetter(1))]

print glo

編集

インポートを必要としない別のソリューションは、読みやすく、注文を保持し、前のものより22%短くなります。

oldlist = [["A",0], ["B",1], ["C",0], ["D",2], ["E",2]]

newlist, dicpos = [],{}
for val,k in oldlist:
    if k in dicpos:
        newlist[dicpos[k]].extend(val)
    else:
        newlist.append([val])
        dicpos[k] = len(dicpos)

print newlist
27
eyquem

ハワードの答えは簡潔でエレガントですが、最悪の場合はO(n ^ 2)でもあります。多数のグループ化キー値を持つ大規模なリストの場合、最初にリストをソートしてから_itertools.groupby_を使用します。

_>>> from itertools import groupby
>>> from operator import itemgetter
>>> seq = [["A",0], ["B",1], ["C",0], ["D",2], ["E",2]]
>>> seq.sort(key = itemgetter(1))
>>> groups = groupby(seq, itemgetter(1))
>>> [[item[0] for item in data] for (key, data) in groups]
[['A', 'C'], ['B'], ['D', 'E']]
_

編集:

Eyequemの答えを見た後でこれを変更しました:itemgetter(1)は_lambda x: x[1]_よりも優れています。

20
Robert Rossney
>>> import collections
>>> D1 = collections.defaultdict(list)
>>> for element in L1:
...     D1[element[1]].append(element[0])
... 
>>> L2 = D1.values()
>>> print L2
[['A', 'C'], ['B'], ['D', 'E']]
>>> 
7
DTing

エレガントについては知りませんが、確かに実行可能です。

oldlist = [["A",0], ["B",1], ["C",0], ["D",2], ["E",2]]
# change into: list = [["A", "C"], ["B"], ["D", "E"]]

order=[]
dic=dict()
for value,key in oldlist:
  try:
    dic[key].append(value)
  except KeyError:
    order.append(key)
    dic[key]=[value]
newlist=map(dic.get, order)

print newlist

これにより、各キーの最初の出現順序と、各キーのアイテムの順序が保持されます。キーはハッシュ可能である必要がありますが、それ以外の場合はキーに意味を割り当てません。

2
Yann Vernier
len = max(key for (item, key) in list)
newlist = [[] for i in range(len+1)]
for item,key in list:
  newlist[key].append(item)

おそらく、よりエレガントですがO(n ** 2)の単一のリスト内包表記でそれを行うことができます。

[[item for (item,key) in list if key==i] for i in range(max(key for (item,key) in list)+1)]
1
sverre