Python ElementTreeを使用して要素ツリーのすべてのサブ要素を取得する方法は？

Question

ElementTree.getchildren()はPythonバージョン2.7で廃止されたため、getchildren()のように要素ツリーのすべてのサブ要素を取得する方法を見つけたい現在はまだ使用できますが、もう使用したくありません。

ありがとう。

Eli Bendersky · Accepted Answer

elemのすべてのサブエレメント（子孫）：

all_descendants = list(elem.iter())

より完全な例：

>>> import xml.etree.ElementTree as ET >>> a = ET.Element('a') >>> b = ET.SubElement(a, 'b') >>> c = ET.SubElement(a, 'c') >>> d = ET.SubElement(a, 'd') >>> e = ET.SubElement(b, 'e') >>> f = ET.SubElement(d, 'f') >>> g = ET.SubElement(d, 'g') >>> [elem.tag for elem in a.iter()] ['a', 'b', 'e', 'c', 'd', 'f', 'g']

ルート自体を除外するには：

>>> [elem.tag for elem in a.iter() if elem is not a] ['b', 'e', 'c', 'd', 'f', 'g']

pepr · Answer

すべての要素「a」を取得したい場合は、以下を使用できます。

a_lst = list(elem.iter('a'))

elemも 'a'の場合は、含まれます。

Turtles Are Cute · Answer

既存の答えのどれもすべての子供を見つけません。このソリューションは、ETreeの代わりにBeautifulSoupを使用しますが、トップレベルだけでなく、すべての子を見つけます。

from bs4 import BeautifulSoup with open(filename) as f: soup = BeautifulSoup(f, 'xml') results = soup.find_all('element_name')

Eypros · Answer

多分これはOPの実際の質問に対応していませんが、より広い意味で、誰かが特定の名前で名前が付けられたすべての要素を取得したい場合、たとえば'オブジェクト'が使用できます（@Turtles Are Cuteの代替アプローチは、少なくとも私にとってはより自然に思えます）。

objs = tree.findall('object')

これもリストを返します。

objs = tree.findall('object')

これもリストを返します。

Harshal Zope · Answer

pydocでは、ノードに対してlist（）メソッドを使用して子要素を取得することが記載されています。
list(elem)