web-dev-qa-db-ja.com

pythonで、2つのリストの共通部分が空であるかどうかを効率的に知る

LとMの2つのリストがあるとします。次に、それらが要素を共有しているかどうかを知りたいと思います。それらが要素を共有しているかどうかを(Pythonで)尋ねる最も速い方法はどれですか?共有するかどうかに関係なく、どの要素を共有するか、いくつ共有するかは関係ありません。

たとえば、この場合

L = [1,2,3,4,5,6]
M = [8,9,10]

私はFalseを取得する必要があり、ここで:

L = [1,2,3,4,5,6]
M = [5,6,7]

私は真になるべきです。

質問が明確であることを願っています。ありがとう!

マヌエル

29
Manuel Aráoz

またはもっと簡潔に

if set(L) & set(M):
    # there is an intersection
else:
    # no intersection

本当にTrueまたはFalseが必要な場合

bool(set(L) & set(M))

いくつかのタイミングを実行した後、これも試してみるのに良いオプションのようです

m_set=set(M)
any(x in m_set  for x in L)

MまたはLのアイテムがハッシュ可能でない場合は、このような効率の低いアプローチを使用する必要があります

any(x in M for x in L)

100個のアイテムリストのタイミングを次に示します。セットの使用は、交差がない場合はかなり速く、かなりの交差がある場合は少し遅くなります。

M=range(100)
L=range(100,200)

timeit set(L) & set(M)
10000 loops, best of 3: 32.3 µs per loop

timeit any(x in M for x in L)
1000 loops, best of 3: 374 µs per loop

timeit m_set=frozenset(M);any(x in m_set  for x in L)
10000 loops, best of 3: 31 µs per loop

L=range(50,150)

timeit set(L) & set(M)
10000 loops, best of 3: 18 µs per loop

timeit any(x in M for x in L)
100000 loops, best of 3: 4.88 µs per loop

timeit m_set=frozenset(M);any(x in m_set  for x in L)
100000 loops, best of 3: 9.39 µs per loop


# Now for some random lists
import random
L=[random.randrange(200000) for x in xrange(1000)]
M=[random.randrange(200000) for x in xrange(1000)]

timeit set(L) & set(M)
1000 loops, best of 3: 420 µs per loop

timeit any(x in M for x in L)
10 loops, best of 3: 21.2 ms per loop

timeit m_set=set(M);any(x in m_set  for x in L)
1000 loops, best of 3: 168 µs per loop

timeit m_set=frozenset(M);any(x in m_set  for x in L)
1000 loops, best of 3: 371 µs per loop
31
John La Rooy

交差点を構築する作業を回避し、交差点が交差することがわかったらすぐに回答を生成するには、次のようにします。

m_set = frozenset(M)
return any(x in m_set for x in L)

pdate: gnibblerはこれを試し、frozenset()の代わりにset()を使用するとより高速に実行されることを発見しました。ファダヤノウ。

5
Darius Bacon

まず、注文する必要がない場合は、setタイプに切り替えます。

それでもリストタイプが必要な場合は、次のようにします。0== False

len(set.intersection(set(L), set(M)))
3
gahooa