.docx
を純粋な[〜#〜] xml [〜#〜]形式で表示したい。
インターネットブラウザーやビジュアルスタジオなどのさまざまなアプリケーションが、Wordでファイルを開きます。
また、ドキュメントの名前を.xml
拡張子に変更してみましたが、メモ帳で開くだけで、理解できない一連のテキストが表示されます。
Zipファイルです。表示するには、末尾を.Zip
に変更してください。
MacOSで作業していて、.docx
ドキュメントのXMLを表示するソフトウェアをインストールしたくないですか?ターミナルを開いて:
cd path/to/your/file.docx
unzip file.docx -d file-content
上記のように、.docx
ファイルは「偽装」されたZipファイルであり、unzip
はmacOSにデフォルトでインストールされます。使用後、file-content
フォルダには、Word文書を構成するさまざまな.xml
ファイルが含まれます。
Notepad ++を使用してdocument.xmlを編集し、Zipファイルを解凍しました(プラグイン/ XMLツール/ XML構文の確認)。 Notepad ++は、スワップされた要素に気づき、要素をより論理的な順序で配置し、問題が見つからなくなるまで手順を繰り返しました。次に、Total Commanderを使用してすべてのファイルを直接Zipにコピーし、最後に* .docxに名前を変更しました。 Wordは問題なくファイルを開きました。
私が言っているのは、Wordがファイルを開くことを拒否する場合、1つ以上のxmlファイルにいくつかの問題がある可能性があるということです。ヒント:IEを使用して、XMLファイルをすばやく確認します。フラットテキストのみが表示されるか、まったく表示されない場合は、xmlに問題がある可能性があります。