Python：XMLをCSVファイルに変換

Question

次のようなXMLファイルがあります。

<hierachy> <att> <Order>1</Order> <attval>Data</attval> <children> <att> <Order>1</Order> <attval>Studyval</attval> </att> <att> <Order>2</Order> <attval>Site</attval> </att> </children> </att> <att> <Order>2</Order> <attval>Info</attval> <children> <att> <Order>1</Order> <attval>age</attval> </att> <att> <Order>2</Order> <attval>gender</attval> </att> </children> </att> </hierachy>

次のようにCSVファイルに変換しようとしています。

Data,Studyval Date,Site Info,age Info,gender

私の問題は、親と子の名前が同じである-'att'と 'attval'です。 Pythonに両方を区別して出力を提供するようにするにはどうすればよいですか？

私はこれを試しました：

import xml.etree.cElementTree as ET tree = ET.parse('input.xml') rebase = tree.getroot() list = [] for att in rebase.findall('att'): name = att.find('attval').text for each_att in att.findall('attval'): try: val = att.find('attval').text print name, val except AttributeError: print name

同じものを2回印刷しました。

Havok · Accepted Answer

ツリー全体でattタグを探すため、findall関数は使用しないでください。ツリーを上から下に順番に繰り返し、それらの関連要素を取得します。

from xml.etree import ElementTree tree = ElementTree.parse('input.xml') root = tree.getroot() for att in root: first = att.find('attval').text for subatt in att.find('children'): second = subatt.find('attval').text print('{},{}'.format(first, second))

それは与える：

$ python process.py Data,Studyval Data,Site Info,age Info,gender