私はWeb APIを作成していますが、適切にフォーマットされたXMLを非常に迅速に生成するための良い方法が必要です。私はPythonでこれを行う良い方法を見つけることができません。
注:一部のライブラリは有望に見えますが、ドキュメントがないか、ファイルにのみ出力されます。
lxml を使用:
from lxml import etree
# create XML
root = etree.Element('root')
root.append(etree.Element('child'))
# another child with text
child = etree.Element('child')
child.text = 'some text'
root.append(child)
# pretty string
s = etree.tostring(root, pretty_print=True)
print s
出力:
<root>
<child/>
<child>some text</child>
</root>
詳細については、 tutorial を参照してください。
ElementTree は、xmlの読み取りと書き込みにも適したモジュールです。
from xml.etree.ElementTree import Element, SubElement, tostring
root = Element('root')
child = SubElement(root, "child")
child.text = "I am a child"
print tostring(root)
出力:
<root><child>I am a child</child></root>
詳細ときれいな印刷方法については、こちらをご覧ください tutorial .
あるいは、XMLが単純な場合は、文字列フォーマットの力を過小評価しないでください:)
xmlTemplate = """<root>
<person>
<name>%(name)s</name>
<address>%(address)s</address>
</person>
</root>"""
data = {'name':'anurag', 'address':'Pune, india'}
print xmlTemplate%data
出力:
<root>
<person>
<name>anurag</name>
<address>Pune, india</address>
</person>
</root>
複雑な書式設定には、string.Templateまたはテンプレートエンジンを使用できます。
yattag ライブラリを使用します。私はそれが最もPython的な方法だと思う:
from yattag import Doc
doc, tag, text = Doc().tagtext()
with tag('food'):
with tag('name'):
text('French Breakfast')
with tag('price', currency='USD'):
text('6.95')
with tag('ingredients'):
for ingredient in ('baguettes', 'jam', 'butter', 'croissants'):
with tag('ingredient'):
text(ingredient)
print(doc.getvalue())
次の場所からlxml.builderクラスを使用します。 http://lxml.de/tutorial.html#the-e-factory
import lxml.builder as lb
from lxml import etree
nstext = "new story"
story = lb.E.Asset(
lb.E.Attribute(nstext, name="Name", act="set"),
lb.E.Relation(lb.E.Asset(idref="Scope:767"),
name="Scope", act="set")
)
print 'story:\n', etree.tostring(story, pretty_print=True)
出力:
story:
<Asset>
<Attribute name="Name" act="set">new story</Attribute>
<Relation name="Scope" act="set">
<Asset idref="Scope:767"/>
</Relation>
</Asset>
純粋なPythonを使用する場合のオプションの方法:
ElementTreeはほとんどの場合に適していますが、CDataおよびpretty print。
したがって、CDataおよびpretty printが必要な場合は、 minidom を使用する必要があります。
minidom_example.py:
from xml.dom import minidom
doc = minidom.Document()
root = doc.createElement('root')
doc.appendChild(root)
leaf = doc.createElement('leaf')
text = doc.createTextNode('Text element with attributes')
leaf.appendChild(text)
leaf.setAttribute('color', 'white')
root.appendChild(leaf)
leaf_cdata = doc.createElement('leaf_cdata')
cdata = doc.createCDATASection('<em>CData</em> can contain <strong>HTML tags</strong> without encoding')
leaf_cdata.appendChild(cdata)
root.appendChild(leaf_cdata)
branch = doc.createElement('branch')
branch.appendChild(leaf.cloneNode(True))
root.appendChild(branch)
mixed = doc.createElement('mixed')
mixed_leaf = leaf.cloneNode(True)
mixed_leaf.setAttribute('color', 'black')
mixed_leaf.setAttribute('state', 'modified')
mixed.appendChild(mixed_leaf)
mixed_text = doc.createTextNode('Do not use mixed elements if it possible.')
mixed.appendChild(mixed_text)
root.appendChild(mixed)
xml_str = doc.toprettyxml(indent=" ")
with open("minidom_example.xml", "w") as f:
f.write(xml_str)
minidom_example.xml:
<?xml version="1.0" ?>
<root>
<leaf color="white">Text element with attributes</leaf>
<leaf_cdata>
<![CDATA[<em>CData</em> can contain <strong>HTML tags</strong> without encoding]]> </leaf_cdata>
<branch>
<leaf color="white">Text element with attributes</leaf>
</branch>
<mixed>
<leaf color="black" state="modified">Text element with attributes</leaf>
Do not use mixed elements if it possible.
</mixed>
</root>
私はこのスレッドでいくつかの解決策を試しましたが、残念なことに、それらのいくつかは扱いにくい(つまり、些細でないことをするときに過度の努力を必要とする)であり、洗練されていません。その結果、好みのソリューション web2py HTMLヘルパーオブジェクト をミックスに投入すると思いました。
まず、 スタンドアロンweb2pyモジュール をインストールします。
pip install web2py
残念ながら、上記は非常に時代遅れのweb2pyのバージョンをインストールしますが、この例では十分でしょう。更新されたソースは here です。
文書化されたweb2py HTMLヘルパーオブジェクトをインポートします here 。
from gluon.html import *
これで、web2pyヘルパーを使用してXML/HTMLを生成できます。
words = ['this', 'is', 'my', 'item', 'list']
# helper function
create_item = lambda idx, Word: LI(Word, _id = 'item_%s' % idx, _class = 'item')
# create the HTML
items = [create_item(idx, Word) for idx,Word in enumerate(words)]
ul = UL(items, _id = 'my_item_list', _class = 'item_list')
my_div = DIV(ul, _class = 'container')
>>> my_div
<gluon.html.DIV object at 0x00000000039DEAC8>
>>> my_div.xml()
# I added the line breaks for clarity
<div class="container">
<ul class="item_list" id="my_item_list">
<li class="item" id="item_0">this</li>
<li class="item" id="item_1">is</li>
<li class="item" id="item_2">my</li>
<li class="item" id="item_3">item</li>
<li class="item" id="item_4">list</li>
</ul>
</div>