大きなXMLファイル(600MB)があり、ターミナルコマンドを使用してCSVに変換したいです。次の構文を使用して、xml2コマンドでXMLをTXTに変換しようとしました。
xml2 <BIG.xml> BIG.txt
私のXML Fromatは
<ReportDetails>
<Date>08/08/2012</Date>
<CaseNo>13030903</CaseNo>
<UserDetailsText>Individual Details</UserDetailsText>
<UserDetails>
<UserId>0903</UserId>
<FirstName>John</FirstName>
<Surname>Perry</Surname>
<Occupation>Developer</Occupation>
<DateofBirth>02/14/1981</DateofBirth>
</UserDetails>
<ApplicationDetailsText>Conflict Resolution Details</ApplicationDetailsText>
<ApplicationDetails>
<ApplicationNo>13033</ApplicationNo>
<ApplicationName>John Perry</ApplicationName>
<Department>Information Technology</Department>
<ApplicationType>Personal</ApplicationType>
<ApplicationDate>06/07/2012</ApplicationDate>
<ApplicationEndDate>09/07/2012</ApplicationEndDate>
<ApplicationStatus>Closed</ApplicationStatus>
</ApplicationDetails>
</ReportDetails>
CSVファイルのこれらのフィールドをパイプ(|)で区切って欲しい
日付| CaseNo | FirstName |姓|アプリケーションApplicationName | ApplicationDate |アプリケーションの状態
また、PHPファイルを介してファイルを実行する場合は、それを実行するためのシェルスクリプトが必要になります。
XSLを使用して、必要な正確な形式への変換を実行します。例えば。、
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" encoding="iso-8859-1"/>
<xsl:strip-space elements="*" />
<xsl:template match="/ReportDetails">
<xsl:value-of select="Date"/><xsl:text>|</xsl:text>
<xsl:value-of select="CaseNo"/><xsl:text>|</xsl:text>
<xsl:apply-templates select="UserDetails" />
</xsl:template>
<xsl:template match="/ReportDetails/UserDetails">
<xsl:value-of select="FirstName"/><xsl:text>|</xsl:text>
<xsl:value-of select="Surname"/><xsl:text>|</xsl:text>
</xsl:template>
<!-- etc -->
</xsl:stylesheet>
次に、上記を指定します(たとえば、foo.xslで元のxmlドキュメントfoo.xmlを変換します):
$ xsltproc foo.xsl foo.xml
08/08/2012|13030903|John|Perry|
(悪魔はxslの詳細にあります...これを実装する方法は多数あります...)