JAXBを使用してデータをXMLにシリアル化します。クラスコードは次のように簡単です。一部のArgsの値のCDATAブロックを含むXMLを生成したい。たとえば、現在のコードは次のXMLを生成します。
<command>
<args>
<arg name="test_id">1234</arg>
<arg name="source"><html>EMAIL</html></arg>
</args>
</command>
「ソース」引数をCDATAでラップして、次のようにします。
<command>
<args>
<arg name="test_id">1234</arg>
<arg name="source"><[![CDATA[<html>EMAIL</html>]]></arg>
</args>
</command>
以下のコードでこれを達成するにはどうすればよいですか?
@XmlRootElement(name="command")
public class Command {
@XmlElementWrapper(name="args")
protected List<Arg> arg;
}
@XmlRootElement(name="arg")
public class Arg {
@XmlAttribute
public String name;
@XmlValue
public String value;
public Arg() {};
static Arg make(final String name, final String value) {
Arg a = new Arg();
a.name=name; a.value=value;
return a; }
}
注:私は EclipseLink JAXB(MOXy) リードおよび JAXB(JSR-222) エキスパートグループのメンバー.
JAXBプロバイダーとしてMOXyを使用している場合、@XmlCDATA
拡張子:
package blog.cdata;
import javax.xml.bind.annotation.XmlRootElement;
import org.Eclipse.persistence.oxm.annotations.XmlCDATA;
@XmlRootElement(name="c")
public class Customer {
private String bio;
@XmlCDATA
public void setBio(String bio) {
this.bio = bio;
}
public String getBio() {
return bio;
}
}
詳細情報
JAXBの Marshaller#marshal(ContentHandler)
を使用して ContentHandler
オブジェクトにマーシャリングします。使用しているContentHandler実装のcharacters
メソッドをオーバーライドするだけです(例:JDOMのSAXHandler
、ApacheのXMLSerializer
など):
_public class CDataContentHandler extends (SAXHandler|XMLSerializer|Other...) {
// see http://www.w3.org/TR/xml/#syntax
private static final Pattern XML_CHARS = Pattern.compile("[<>&]");
public void characters(char[] ch, int start, int length) throws SAXException {
boolean useCData = XML_CHARS.matcher(new String(ch,start,length)).find();
if (useCData) super.startCDATA();
super.characters(ch, start, length);
if (useCData) super.endCDATA();
}
}
_
要素のリストをハードコーディングする必要がないため、これはXMLSerializer.setCDataElements(...)
メソッドを使用するよりもはるかに優れています。必要な場合にのみ、CDATAブロックを自動的に出力します。
ソリューションのレビュー:
XMLStreamWriter実装を使用して、a2ndradeのソリューションを変更しました。このソリューションは非常にうまく機能します。
XMLOutputFactory xof = XMLOutputFactory.newInstance();
XMLStreamWriter streamWriter = xof.createXMLStreamWriter( System.out );
CDataXMLStreamWriter cdataStreamWriter = new CDataXMLStreamWriter( streamWriter );
marshaller.marshal( jaxbElement, cdataStreamWriter );
cdataStreamWriter.flush();
cdataStreamWriter.close();
これがCDataXMLStreamWriter実装です。デリゲートクラスは、すべてのメソッド呼び出しを指定されたXMLStreamWriter実装に単純にデリゲートします。
import Java.util.regex.Pattern;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.XMLStreamWriter;
/**
* Implementation which is able to decide to use a CDATA section for a string.
*/
public class CDataXMLStreamWriter extends DelegatingXMLStreamWriter
{
private static final Pattern XML_CHARS = Pattern.compile( "[&<>]" );
public CDataXMLStreamWriter( XMLStreamWriter del )
{
super( del );
}
@Override
public void writeCharacters( String text ) throws XMLStreamException
{
boolean useCData = XML_CHARS.matcher( text ).find();
if( useCData )
{
super.writeCData( text );
}
else
{
super.writeCharacters( text );
}
}
}
上記のサイトで参照されているコードサンプルは次のとおりです。
import Java.io.File;
import Java.io.StringWriter;
import javax.xml.bind.JAXBContext;
import javax.xml.bind.Marshaller;
import javax.xml.bind.Unmarshaller;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.Apache.xml.serialize.OutputFormat;
import org.Apache.xml.serialize.XMLSerializer;
import org.w3c.dom.Document;
public class JaxbCDATASample {
public static void main(String[] args) throws Exception {
// unmarshal a doc
JAXBContext jc = JAXBContext.newInstance("...");
Unmarshaller u = jc.createUnmarshaller();
Object o = u.unmarshal(...);
// create a JAXB marshaller
Marshaller m = jc.createMarshaller();
// get an Apache XMLSerializer configured to generate CDATA
XMLSerializer serializer = getXMLSerializer();
// marshal using the Apache XMLSerializer
m.marshal(o, serializer.asContentHandler());
}
private static XMLSerializer getXMLSerializer() {
// configure an OutputFormat to handle CDATA
OutputFormat of = new OutputFormat();
// specify which of your elements you want to be handled as CDATA.
// The use of the '^' between the namespaceURI and the localname
// seems to be an implementation detail of the xerces code.
// When processing xml that doesn't use namespaces, simply omit the
// namespace prefix as shown in the third CDataElement below.
of.setCDataElements(
new String[] { "ns1^foo", // <ns1:foo>
"ns2^bar", // <ns2:bar>
"^baz" }); // <baz>
// set any other options you'd like
of.setPreserveSpace(true);
of.setIndenting(true);
// create the serializer
XMLSerializer serializer = new XMLSerializer(of);
serializer.setOutputByteStream(System.out);
return serializer;
}
}
マイケル・エルンストと同じ理由で、私はここでの答えのほとんどに満足していませんでした。 raiglstorferのOutputFormatソリューションのように、定義済みのフィールドセットにCDATAタグを配置する必要があるため、彼のソリューションは使用できませんでした。
私の解決策は、DOMドキュメントにマーシャリングしてから、出力を行うためにnull XSL変換を行うことです。トランスフォーマーを使用すると、CDATAタグでラップする要素を設定できます。
Document document = ...
jaxbMarshaller.marshal(jaxbObject, document);
Transformer nullTransformer = TransformerFactory.newInstance().newTransformer();
nullTransformer.setOutputProperty(OutputKeys.INDENT, "yes");
nullTransformer.setOutputProperty(OutputKeys.CDATA_SECTION_ELEMENTS, "myElement {myNamespace}myOtherElement");
nullTransformer.transform(new DOMSource(document), new StreamResult(writer/stream));
詳細はこちら: http://javacoalface.blogspot.co.uk/2012/09/outputting-cdata-sections-with-jaxb.html
次の簡単な方法は、CDATAをネイティブにサポートしないJAX-BのCDATAサポートを追加します。
出来上がり、CDataString要素はマーシャル時にカプセル化されます。非整列化時に、は自動的に削除されます。
@a2ndrade
の回答の補足。
JDK 8で拡張するクラスが1つありますが、クラスはcom.Sun
パッケージにあることに注意してください。このクラスが将来のJDKで削除される可能性がある場合に備えて、コードのコピーを1つ作成できます。
public class CDataContentHandler extends com.Sun.xml.internal.txw2.output.XMLWriter {
public CDataContentHandler(Writer writer, String encoding) throws IOException {
super(writer, encoding);
}
// see http://www.w3.org/TR/xml/#syntax
private static final Pattern XML_CHARS = Pattern.compile("[<>&]");
public void characters(char[] ch, int start, int length) throws SAXException {
boolean useCData = XML_CHARS.matcher(new String(ch, start, length)).find();
if (useCData) {
super.startCDATA();
}
super.characters(ch, start, length);
if (useCData) {
super.endCDATA();
}
}
}
使い方:
JAXBContext jaxbContext = JAXBContext.newInstance(...class);
Marshaller marshaller = jaxbContext.createMarshaller();
StringWriter sw = new StringWriter();
CDataContentHandler cdataHandler = new CDataContentHandler(sw,"utf-8");
marshaller.marshal(gu, cdataHandler);
System.out.println(sw.toString());
結果の例:
<?xml version="1.0" encoding="utf-8"?>
<genericUser>
<password><![CDATA[dskfj>><<]]></password>
<username>UNKNOWN::UNKNOWN</username>
<properties>
<prop2>v2</prop2>
<prop1><![CDATA[v1><]]></prop1>
</properties>
<timestamp/>
<uuid>cb8cbc487ee542ec83e934e7702b9d26</uuid>
</genericUser>
Xerxes-J 2.9の時点で、XMLSerializerは非推奨になりました。提案は、DOM Level 3 LSSerializerまたはJAXPのXML用変換APIに置き換えることです。誰かがアプローチを試みましたか?
警告の言葉:javax.xml.transform.Transformer.setOutputProperty(...)のドキュメントによると、別のネームスペースの要素を示す場合は、修飾名の構文を使用する必要があります。 JavaDoc(Java 1.6 rt.jar)によると:
"(...)たとえば、URIで定義された要素からURIとローカル名が取得された場合、修飾名は" { http://xyz.foo.com/yada/baz.html } foo。プレフィックスが使用されていないことに注意してください。」
これは機能しません-Java 1.6 rt.jarからの実装クラスは、com.Sun.org.Apache.xalan.internal.xsltc.trax.TransformerImplが異なるに属する要素を解釈することを意味します名前空間が「 http://xyz.foo.com/yada/baz.html:foo 」として宣言されている場合にのみ、名前空間は正しく実装されます。 。したがって、呼び出す代わりに:
transformer.setOutputProperty(OutputKeys.CDATA_SECTION_ELEMENTS, "{http://xyz.foo.com/yada/baz.html}foo")
javaDocに従って動作するはずですが、「http」と「//xyz.foo.com/yada/baz.html」として解析されることになります。
transformer.setOutputProperty(OutputKeys.CDATA_SECTION_ELEMENTS, "http://xyz.foo.com/yada/baz.html:foo")
少なくともJava 1.6。
次のコードは、CDATA要素のエンコードを防ぎます。
Marshaller marshaller = context.createMarshaller();
marshaller.setProperty(Marshaller.JAXB_ENCODING, "UTF-8");
marshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true);
StringWriter stringWriter = new StringWriter();
PrintWriter printWriter = new PrintWriter(stringWriter);
DataWriter dataWriter = new DataWriter(printWriter, "UTF-8", new CharacterEscapeHandler() {
@Override
public void escape(char[] buf, int start, int len, boolean b, Writer out) throws IOException {
out.write(buf, start, len);
}
});
marshaller.marshal(data, dataWriter);
System.out.println(stringWriter.toString());
また、UTF-8
エンコーディングとして。