ElementTree1.2での名前空間プレフィックスの抑制

Question

python 2.7（etree 1.3を使用）では、次のような要素のXMLプレフィックスを抑制できます。

Python 2.7.1 (r271:86832, Jun 16 2011, 16:59:05) [GCC 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2335.15.00)] on darwin Type "help", "copyright", "credits" or "license" for more information. >>> import xml.etree.ElementTree as etree >>> etree.VERSION '1.3.0' >>> something = etree.Element('{http://some.namespace}token') >>> etree.tostring(something) '<ns0:token xmlns:ns0="http://some.namespace" />' >>> etree.register_namespace('', 'http://some.namespace') >>> etree.tostring(something) '<token xmlns="http://some.namespace" />'

register_namespace関数は1.3で追加されました。 python 2.6のバージョン1.2.6のetreeと互換性のある方法でプレフィックスを削除しようとしています。これが私が試したことです：

Python 2.6.7 (r267:88850, Jul 31 2011, 19:30:54) [GCC 4.2.1 (Based on Apple Inc. build 5658) (LLVM build 2335.15.00)] on darwin Type "help", "copyright", "credits" or "license" for more information. >>> import xml.etree.ElementTree as etree >>> etree.VERSION '1.2.6' >>> something = etree.Element('{http://some.namespace}token') >>> etree.tostring(something) '<ns0:token xmlns:ns0="http://some.namespace" />' >>> etree._namespace_map['http://some.namespace'] = '' >>> etree.tostring(something) '<:token xmlns:="http://some.namespace" />'

これは私が望むものではありません。プレフィックスはまだありますが、空白です。それらを完全に削除する方法はありますか？

jterrace · Accepted Answer

python2.6のElementTreeのソースコードを見た後、:はfixtag関数にハードコードされています。回避策として、これが私がしたことです：

from xml.etree import ElementTree as etree if etree.VERSION[0:3] == '1.2': #in etree < 1.3, this is a workaround for supressing prefixes def fixtag(tag, namespaces): import string # given a decorated tag (of the form {uri}tag), return prefixed # tag and namespace declaration, if any if isinstance(tag, etree.QName): tag = tag.text namespace_uri, tag = string.split(tag[1:], "}", 1) prefix = namespaces.get(namespace_uri) if namespace_uri not in namespaces: prefix = etree._namespace_map.get(namespace_uri) if namespace_uri not in etree._namespace_map: prefix = "ns%d" % len(namespaces) namespaces[namespace_uri] = prefix if prefix == "xml": xmlns = None else: if prefix is not None: nsprefix = ':' + prefix else: nsprefix = '' xmlns = ("xmlns%s" % nsprefix, namespace_uri) else: xmlns = None if prefix is not None: prefix += ":" else: prefix = '' return "%s%s" % (prefix, tag), xmlns etree.fixtag = fixtag etree._namespace_map['http://some.namespace'] = None else: #For etree > 1.3, use register_namespace function etree.register_namespace('', 'http://some.namespace')

この投稿が古くなった場合に備えて、コードは維持されますここ。

Ryan Anguiano · Answer

ファイルの先頭にメソッドを作成し、タグ文字列があるべき場所でそれを使用するだけです。「ns_tag」という名前を付けましたが、好きな名前を付けることができます。

def ns_tag(tag): return str( ElementTree.QName('http://some.namespace/api/4/', tag) )

例：

root = ElementTree.fromstring(xml) success = root.find(ns_tag('success')) if success.text == 'true': for node in root.find(ns_tag('items')): id = node.find(ns_tag('id')).text ...

Franck Barbenoire · Answer

タグから名前空間を削除するために、このコードを使用します。ここで、タゲットオブジェクトはTreeBuilderのサブクラスです。 startとendの両方の方法で、不要な名前空間を削除します。

from xml.etree.ElementTree import XML, XMLParser, tostring, TreeBuilder class StripNamespace(TreeBuilder): def start(self, tag, attrib): index = tag.find('}') if index != -1: tag = tag[index+1:] super(StripNamespace, self).start(tag, attrib) def end(self, tag): index = tag.find('}') if index != -1: tag = tag[index+1:] super(StripNamespace, self).end(tag) target = StripNamespace() parser = XMLParser(target=target) with open("DmsDesc.xml") as f: content = f.read() root = XML(content, parser=parser) print tostring(root)

シンプルでかわいらしい。

Kevin · Answer

これはハックですが、これはJython2.5.2でうまく機能しました

 ns=re.match('^\{([^\}]+)\}', mydoc.getroot().tag ).group(1) etree._namespace_map[ns]='STRIPME' etree.tostring( mydoc.getroot() ).replace( 'STRIPME:', '' )