web-dev-qa-db-ja.com

リスト/タプルを(リスト/タプル)ソートするにはどうすればいいですか?

このように、リストのリストかタプルのリストのどちらかにデータがあります。

data = [[1,2,3], [4,5,6], [7,8,9]]
data = [(1,2,3), (4,5,6), (7,8,9)]

そして、サブセットの2番目の要素でソートしたいと思います。つまり、2(1,2,3)から、5(4,5,6)からです。これを行う一般的な方法は何ですか?リストにタプルまたはリストを格納する必要がありますか?

512
Stan
sorted_by_second = sorted(data, key=lambda tup: tup[1])

または

data.sort(key=lambda tup: tup[1])  # sorts in place
909
Stephen
from operator import itemgetter
data.sort(key=itemgetter(1))
174
manova

もしあなたが配列を高いものから低いものへソートしたいのであれば、私はスティーブンの答えに加えたいと思います。

reverse = True

結果は次のようになります。

data.sort(key=lambda tup: tup[1], reverse=True)
39
sifoo

複数の基準、つまりタプルの2番目と3番目の要素でソートするには、

data = [(1,2,3),(1,2,1),(1,1,4)]

そのため、優先度を記述するタプルを返すラムダを定義します。例えば、

sorted(data, key=lambda tup: (tup[1],tup[2]) )
[(1, 1, 4), (1, 2, 1), (1, 2, 3)]
28
elm

Stephen's answer は私が使うものです。完全を期すために、ここにリスト内包表記を含むDSU(decorate-sort-undecorate)パターンを示します。

decorated = [(tup[1], tup) for tup in data]
decorated.sort()
undecorated = [tup for second, tup in decorated]

または、もっと簡潔に言うと:

[b for a,b in sorted((tup[1], tup) for tup in data)]

Pythonの並べ替えの手引き で述べたように、これはPython 2.4から、キー機能が利用可能になったときから不要でした。

26
tcarobruce

countをアルファベット順に、そしてWordをアルファベット順にソートして、タプルのリスト(<Word>, <count>)をソートします。

data = [
('betty', 1),
('bought', 1),
('a', 1),
('bit', 1),
('of', 1),
('butter', 2),
('but', 1),
('the', 1),
('was', 1),
('bitter', 1)]

私はこの方法を使います。

sorted(data, key=lambda tup:(-tup[1], tup[0]))

そしてそれは私に結果を与える:

[('butter', 2),
('a', 1),
('betty', 1),
('bit', 1),
('bitter', 1),
('bought', 1),
('but', 1),
('of', 1),
('the', 1),
('was', 1)]
11
l mingzhi

ラムダなし

def sec_elem(s):
 return s [1] 
ソート済み(data、key = sec_elem) 
8
Mesco

@ステフェンの答えは要点です!より良い視覚化のための例はここにあります、

Ready Player Oneファンに声をかけてください。 =)

>>> gunters = [('2044-04-05', 'parzival'), ('2044-04-07', 'aech'), ('2044-04-06', 'art3mis')]
>>> gunters.sort(key=lambda tup: tup[0])
>>> print gunters
[('2044-04-05', 'parzival'), ('2044-04-06', 'art3mis'), ('2044-04-07', 'aech')]

keyは、比較のためにコレクションの項目を変換するために呼び出される関数です。JavaのcompareToメソッドのように。

Keyに渡されるパラメータは呼び出し可能なものでなければなりません。ここでは、lambdaを使用すると無名関数(呼び出し可能)が作成されます。
lambdaの構文は、lambdaという単語の後に反復可能な名前、そして単一のコードブロックを続けたものです。

以下の例では、特定のイベントの情報およびアクター名の情報を保持するTupleのリストをソートしています。

このリストをイベント発生時刻順に並べ替えています。これは、Tupleの0番目の要素です。

注 - s.sort([cmp[, key[, reverse]]])はsの項目を定位置にソートします

5
Rishi

itemgetter()lambda tup: tup[1]よりいくらか速いですが、増加は比較的緩やかです(およそ10から25パーセント)。

(IPythonセッション)

>>> from operator import itemgetter
>>> from numpy.random import randint
>>> values = randint(0, 9, 30000).reshape((10000,3))
>>> tpls = [Tuple(values[i,:]) for i in range(len(values))]

>>> tpls[:5]    # display sample from list
[(1, 0, 0), 
 (8, 5, 5), 
 (5, 4, 0), 
 (5, 7, 7), 
 (4, 2, 1)]

>>> sorted(tpls[:5], key=itemgetter(1))    # example sort
[(1, 0, 0), 
 (4, 2, 1), 
 (5, 4, 0), 
 (8, 5, 5), 
 (5, 7, 7)]

>>> %timeit sorted(tpls, key=itemgetter(1))
100 loops, best of 3: 4.89 ms per loop

>>> %timeit sorted(tpls, key=lambda tup: tup[1])
100 loops, best of 3: 6.39 ms per loop

>>> %timeit sorted(tpls, key=(itemgetter(1,0)))
100 loops, best of 3: 16.1 ms per loop

>>> %timeit sorted(tpls, key=lambda tup: (tup[1], tup[0]))
100 loops, best of 3: 17.1 ms per loop
4
Walter