次のPythonリストがあります(タプルにすることもできます)。
myList = ['foo', 'bar', 'baz', 'quux']
私は言うことができます
>>> myList[0:3]
['foo', 'bar', 'baz']
>>> myList[::2]
['foo', 'baz']
>>> myList[1::2]
['bar', 'quux']
インデックスに特定のパターンがないアイテムを明示的に選択するにはどうすればよいですか?たとえば、[0,2,3]
を選択します。または、1000項目の非常に大きなリストから、[87, 342, 217, 998, 500]
を選択します。それを行うPython構文はありますか?次のようなもの:
>>> myBigList[87, 342, 217, 998, 500]
list( myBigList[i] for i in [87, 342, 217, 998, 500] )
回答をpython 2.5.2と比較しました:
19.7 usec:[ myBigList[i] for i in [87, 342, 217, 998, 500] ]
20.6 usec:map(myBigList.__getitem__, (87, 342, 217, 998, 500))
22.7 usec:itemgetter(87, 342, 217, 998, 500)(myBigList)
24.6 usec:list( myBigList[i] for i in [87, 342, 217, 998, 500] )
Python 3では、1番目が4番目と同じになるように変更されました。
別のオプションは、リストまたはnumpy.array
を介したインデックス作成を許可するnumpy.array
で開始することです。
>>> import numpy
>>> myBigList = numpy.array(range(1000))
>>> myBigList[(87, 342, 217, 998, 500)]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: invalid index
>>> myBigList[[87, 342, 217, 998, 500]]
array([ 87, 342, 217, 998, 500])
>>> myBigList[numpy.array([87, 342, 217, 998, 500])]
array([ 87, 342, 217, 998, 500])
Tuple
は、スライスと同じようには機能しません。
これはどうですか:
from operator import itemgetter
itemgetter(0,2,3)(myList)
('foo', 'baz', 'quux')
組み込みではありませんが、必要に応じて、タプルを「インデックス」としてとるリストのサブクラスを作成できます。
class MyList(list):
def __getitem__(self, index):
if isinstance(index, Tuple):
return [self[i] for i in index]
return super(MyList, self).__getitem__(index)
seq = MyList("foo bar baaz quux mumble".split())
print seq[0]
print seq[2,4]
print seq[1::2]
印刷
foo
['baaz', 'mumble']
['bar', 'quux']
たぶん、リストの理解は適切です:
L = ['a', 'b', 'c', 'd', 'e', 'f']
print [ L[index] for index in [1,3,5] ]
生産物:
['b', 'd', 'f']
それはあなたが探しているものですか?
>>> map(myList.__getitem__, (2,2,1,3))
('baz', 'baz', 'bar', 'quux')
myList[(2,2,1,3)]
を実行したい場合は、__getitem__
への引数としてタプルをサポートする独自のList
クラスを作成することもできます。
指摘したいのは、itemgetterの構文でさえすっきりしているように見えますが、大きなリストで実行する場合は少し遅いです。
import timeit
from operator import itemgetter
start=timeit.default_timer()
for i in range(1000000):
itemgetter(0,2,3)(myList)
print ("Itemgetter took ", (timeit.default_timer()-start))
Itemgetterは1.065209062149279を取りました
start=timeit.default_timer()
for i in range(1000000):
myList[0],myList[2],myList[3]
print ("Multiple slice took ", (timeit.default_timer()-start))
複数のスライスに0.6225321444745759かかりました
別の可能な解決策:
sek=[]
L=[1,2,3,4,5,6,7,8,9,0]
for i in [2, 4, 7, 0, 3]:
a=[L[i]]
sek=sek+a
print (sek)
mask
のようなブール値のnumpy配列がある場合によくある
[mylist[i] for i in np.arange(len(mask), dtype=int)[mask]]
任意のシーケンスまたはnp.arrayで機能するラムダ:
subseq = lambda myseq, mask : [myseq[i] for i in np.arange(len(mask), dtype=int)[mask]]
newseq = subseq(myseq, mask)