web-dev-qa-db-ja.com

PythonのElementTreeを使用した名前空間仕様の発行

XML宣言と名前空間を含む要素ツリーを含むXMLファイルを出力しようとしています。これが私のサンプルコードです:

from xml.etree import ElementTree as ET
ET.register_namespace('com',"http://www.company.com") #some name

# build a tree structure
root = ET.Element("STUFF")
body = ET.SubElement(root, "MORE_STUFF")
body.text = "STUFF EVERYWHERE!"

# wrap it in an ElementTree instance, and save as XML
tree = ET.ElementTree(root)

tree.write("page.xml",
           xml_declaration=True,
           method="xml" )

ただし、<?xmlタグが出ない、名前空間/接頭辞情報もない。私はここで少し混乱しています。

29
Paul Nathan

docs は別の言い方をしますが、私は<?xml>宣言。xml_declarationとエンコーディングの両方を指定します。

ファイル内のノードの名前空間を取得するには、登録した名前空間でノードを宣言する必要があります。これがコードの修正バージョンです。

from xml.etree import ElementTree as ET
ET.register_namespace('com',"http://www.company.com") #some name

# build a tree structure
root = ET.Element("{http://www.company.com}STUFF")
body = ET.SubElement(root, "{http://www.company.com}MORE_STUFF")
body.text = "STUFF EVERYWHERE!"

# wrap it in an ElementTree instance, and save as XML
tree = ET.ElementTree(root)

tree.write("page.xml",
           xml_declaration=True,encoding='utf-8',
           method="xml")

出力(page.xml)

<?xml version='1.0' encoding='utf-8'?><com:STUFF xmlns:com="http://www.company.com"><com:MORE_STUFF>STUFF EVERYWHERE!</com:MORE_STUFF></com:STUFF>

ElementTreeもきれいに印刷しません。これはきれいに印刷された出力です:

<?xml version='1.0' encoding='utf-8'?>
<com:STUFF xmlns:com="http://www.company.com">
    <com:MORE_STUFF>STUFF EVERYWHERE!</com:MORE_STUFF>
</com:STUFF>

デフォルトの名前空間を宣言することもでき、登録する必要はありません。

from xml.etree import ElementTree as ET

# build a tree structure
root = ET.Element("{http://www.company.com}STUFF")
body = ET.SubElement(root, "{http://www.company.com}MORE_STUFF")
body.text = "STUFF EVERYWHERE!"

# wrap it in an ElementTree instance, and save as XML
tree = ET.ElementTree(root)

tree.write("page.xml",
           xml_declaration=True,encoding='utf-8',
           method="xml",default_namespace='http://www.company.com')

出力(かなりの印刷間隔は私のものです)

<?xml version='1.0' encoding='utf-8'?>
<STUFF xmlns="http://www.company.com">
    <MORE_STUFF>STUFF EVERYWHERE!</MORE_STUFF>
</STUFF>
34
Mark Tolonen

プログラムで要素ツリーライブラリから<?xmlタグを取得することはできなかったので、このようなことを試すことをお勧めします。

from xml.etree import ElementTree as ET
root = ET.Element("STUFF")
root.set('com','http://www.company.com')
body = ET.SubElement(root, "MORE_STUFF")
body.text = "STUFF EVERYWHERE!"

f = open('page.xml', 'w')
f.write('<?xml version="1.0" encoding="UTF-8"?>' + ET.tostring(root))
f.close()

非std lib python ElementTreeの実装では、名前空間を指定する方法が異なる可能性があるため、lxmlに移行する場合、それらを宣言する方法は異なります。

8
Philip Southam