SOAP PythonでXMLを解析する方法は？

Question

Goal： <Name>タグ内の値を取得して出力します。 以下の簡略化されたXML

<?xml version="1.0" encoding="UTF-8"?> <soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"> <soap:Body> <GetStartEndPointResponse xmlns="http://www.etis.fskab.se/v1.0/ETISws"> <GetStartEndPointResult> <Code>0</Code> <Message /> <StartPoints> <Point> <Id>545</Id> <Name>Get Me</Name> <Type>sometype</Type> <X>333</X> <Y>222</Y> </Point> <Point> <Id>634</Id> <Name>Get me too</Name> <Type>sometype</Type> <X>555</X> <Y>777</Y> </Point> </StartPoints> </GetStartEndPointResult> </GetStartEndPointResponse> </soap:Body> </soap:Envelope>

試行：

import requests from xml.etree import ElementTree response = requests.get('http://www.labs.skanetrafiken.se/v2.2/querystation.asp?inpPointfr=yst') # XML parsing here dom = ElementTree.fromstring(response.text) names = dom.findall('*/Name') for name in names: print(name.text)

Soap xmlの解析にzeepを推奨している他の人を読んだことがありますが、頭を動かすのが難しいと感じました。

Daniel Corin · Answer

ここでの問題は、XML名前空間の処理です。

import requests from xml.etree import ElementTree response = requests.get('http://www.labs.skanetrafiken.se/v2.2/querystation.asp?inpPointfr=yst') # define namespace mappings to use as shorthand below namespaces = { 'soap': 'http://schemas.xmlsoap.org/soap/envelope/', 'a': 'http://www.etis.fskab.se/v1.0/ETISws', } dom = ElementTree.fromstring(response.content) # reference the namespace mappings here by `<name>:` names = dom.findall( './soap:Body' '/a:GetStartEndPointResponse' '/a:GetStartEndPointResult' '/a:StartPoints' '/a:Point' '/a:Name', namespaces, ) for name in names: print(name.text)

名前空間は、それぞれEnvelopeおよびGetStartEndPointResponseノードのxmlns:soap="http://schemas.xmlsoap.org/soap/envelope/"およびxmlns="http://www.etis.fskab.se/v1.0/ETISws"属性から取得されます。

名前空間が子のタグで<namespace:tag>として明示的に指定されていなくても、名前空間は親のすべての子ノードに継承されることに注意してください。

注：response.contentではなくresponse.bodyを使用する必要がありました。

Samir Sadek · Answer

古い質問ですが、このタスクの別のオプションについて言及する価値があります。

xmltodict （Github） XMLからpython辞書への軽量コンバーターです。

stackという名前の変数でSOAP応答を受け取ります

xmltodict.parseで解析します

In [48]: stack_d = xmltodict.parse(stack)

結果を確認します。

In [49]: stack_d Out[49]: OrderedDict([('soap:Envelope', OrderedDict([('@xmlns:soap', 'http://schemas.xmlsoap.org/soap/envelope/'), ('@xmlns:xsd', 'http://www.w3.org/2001/XMLSchema'), ('@xmlns:xsi', 'http://www.w3.org/2001/XMLSchema-instance'), ('soap:Body', OrderedDict([('GetStartEndPointResponse', OrderedDict([('@xmlns', 'http://www.etis.fskab.se/v1.0/ETISws'), ('GetStartEndPointResult', OrderedDict([('Code', '0'), ('Message', None), ('StartPoints', OrderedDict([('Point', [OrderedDict([('Id', '545'), ('Name', 'Get Me'), ('Type', 'sometype'), ('X', '333'), ('Y', '222')]), OrderedDict([('Id', '634'), ('Name', 'Get me too'), ('Type', 'sometype'), ('X', '555'), ('Y', '777')])])]))]))]))]))]))])

この時点で、python辞書を閲覧するのと同じくらい簡単になります

In [50]: stack_d['soap:Envelope']['soap:Body']['GetStartEndPointResponse']['GetStartEndPointResult']['StartPoints']['Point'] Out[50]: [OrderedDict([('Id', '545'), ('Name', 'Get Me'), ('Type', 'sometype'), ('X', '333'), ('Y', '222')]), OrderedDict([('Id', '634'), ('Name', 'Get me too'), ('Type', 'sometype'), ('X', '555'), ('Y', '777')])]