web-dev-qa-db-ja.com

リスト内の連続する重複を識別するための最もPython的な方法は何ですか?

整数のリストがあり、重複の連続ブロックを識別できるようにしたいです。つまり、各重複に含まれる重複の順序を保持するリストを作成したいと思います(int_in_question、出現回数)。

たとえば、次のようなリストがある場合:

[0, 0, 0, 3, 3, 2, 5, 2, 6, 6]

結果は次のようになります。

[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

かなり forループ、temp、およびカウンターを使用してこれを行う簡単な方法があります。

result_list = []
current = source_list[0]
count = 0
for value in source_list:
    if value == current:
        count += 1
    else:
        result_list.append((current, count))
        current = value
        count = 1
result_list.append((current, count))

しかし、私はPythonの関数型プログラミングのイディオムが本当に好きで、単純なジェネレーター式でこれを実行できるようにしたいと思います。ただし、ジェネレーターを使用する場合、サブカウントを維持するのは難しいと思います。 2段階のプロセスでそこにたどり着くかもしれないと感じていますが、今のところ困惑しています。

特にジェネレーターを使用して、これを行うための特にエレガントでPythonicな方法はありますか?

30
>>> from itertools import groupby
>>> L = [0, 0, 0, 3, 3, 2, 5, 2, 6, 6]
>>> grouped_L = [(k, sum(1 for i in g)) for k,g in groupby(L)]
>>> # Or (k, len(list(g))), but that creates an intermediate list
>>> grouped_L
[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

バッテリーを含む 、彼らが言うように。

JBernardoからのsumとジェネレータ式の使用に関する提案。コメントを参照してください。

49
Josh Caswell