<！[CDATA []]>のXMLを解析する方法

Question

<![CDATA[---]...に含まれるデータを含むXMLを解析する方法xmlを解析し、CDATAに含まれるデータを取得するにはどうすればよいですか？

Thargor · Accepted Answer

public static void main(String[] args) throws Exception { File file = new File("data.xml"); DocumentBuilder builder = DocumentBuilderFactory.newInstance().newDocumentBuilder(); //if you are using this code for blackberry xml parsing builder.setCoalescing(true); Document doc = builder.parse(file); NodeList nodes = doc.getElementsByTagName("topic"); for (int i = 0; i < nodes.getLength(); i++) { Element element = (Element) nodes.item(i); NodeList title = element.getElementsByTagName("title"); Element line = (Element) title.item(0); System.out.println("Title: " + getCharacterDataFromElement(line)); } } public static String getCharacterDataFromElement(Element e) { Node child = e.getFirstChild(); if (child instanceof CharacterData) { CharacterData cd = (CharacterData) child; return cd.getData(); } return ""; }

（ http://www.Java2s.com/Code/Java/XML/GetcharacterdataCDATAfromxmldocument.htm ）

jschnasse · Answer

以前のすべての回答は [〜＃〜] dom [〜＃〜] ベースのアプローチを使用しているためです。これは、 [〜＃〜] stax [〜＃〜] を使用してストリームベースのアプローチでCDATAを解析する方法です。

次のパターンを使用します。

 switch (EventType) { case XMLStreamConstants.CHARACTERS: case XMLStreamConstants.CDATA: System.out.println(r.getText()); break; default: break; }

完全なサンプル：

import Java.io.BufferedInputStream; import Java.io.FileInputStream; import Java.io.InputStream; import javax.xml.stream.XMLInputFactory; import javax.xml.stream.XMLStreamConstants; import javax.xml.stream.XMLStreamReader; public void readCDATAFromXMLUsingStax() { String yourSampleFile = "/path/toYour/sample/file.xml"; XMLStreamReader r = null; try (InputStream in = new BufferedInputStream(new FileInputStream(yourSampleFile));) { XMLInputFactory factory = XMLInputFactory.newInstance(); r = factory.createXMLStreamReader(in); while (r.hasNext()) { switch (r.getEventType()) { case XMLStreamConstants.CHARACTERS: case XMLStreamConstants.CDATA: System.out.println(r.getText()); break; default: break; } r.next(); } } catch (Exception e) { throw new RuntimeException(e); } finally { if (r != null) { try { r.close(); } catch (Exception e) { throw new RuntimeException(e); } } } }

/path/toYour/sample/file.xmlを使用

 <data> <![CDATA[ Sat Nov 19 18:50:15 2016 (1672822)]]> <![CDATA[Sat, 19 Nov 2016 18:50:14 -0800 (PST)]]> </data>

与える：

 Sat Nov 19 18:50:15 2016 (1672822) Sat, 19 Nov 2016 18:50:14 -0800 (PST)

AlexR · Answer

CDATAは、含まれているデータをエスケープしてはならないことを示しています。したがって、タグテキストを取得するだけです。 XMLパーサーは、CDATAなしでクリアデータを返す必要があります。

fresher · Answer

ここでr.get().getResponseBody()は応答本文です

Document doc = getDomElement(r.get().getResponseBody()); NodeList nodes = doc.getElementsByTagName("Title"); for (int i = 0; i < nodes.getLength(); i++) { Element element = (Element) nodes.item(i); NodeList title = element.getElementsByTagName("Child tag where cdata present"); Element line = (Element) title.item(0); System.out.println("Title: "+ getCharacterDataFromElement(line)); public static Document getDomElement(String xml) { Document doc = null; DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); dbf.setCoalescing(true); dbf.setNamespaceAware(true); try { DocumentBuilder db = dbf.newDocumentBuilder(); InputSource is = new InputSource(); is.setCharacterStream(new StringReader(xml)); doc = db.parse(is); } catch (Exception e) { e.printStackTrace(); } return doc; } public static String getCharacterDataFromElement(Element e) { Node child = e.getFirstChild(); if (child instanceof CharacterData) { CharacterData cd = (CharacterData) child; return cd.getData(); } return ""; }