そのため、通常はこの機能(「Webページとして保存」)は使用しませんが、クライアントから大量のドキュメントをHTMLとしてサイトに配置するだけで、すべてを手作業でフォーマットするのは時間の無駄のようです。
Word 2007で「Webページとして保存」を試みましたが、あらゆる種類の悪いものが生成されます。機知に:
<b style='mso-bidi-font-weight:normal'>
<span style="mso-spacerun: yes">
xMLフォーマット情報の大きなブロックと同様に:
<!--[if gte mso 9]><xml>
<o:DocumentProperties>
<o:Subject> </o:Subject>
<o:Author> </o:Author>
<o:Keywords> </o:Keywords>
...
私が言ったように、すべてを手作業でフォーマットするのは時間の無駄のように思えますが、現在MSがエクスポートする方法にはtoo much cruftがあります。これなしでMS Word文書をhtmlとしてエクスポートする方法はありますか?
編集:このドキュメントは憲章/細則タイプのドキュメントであり、そのため多くのレベルのネストされたリストがあります。この変換の試みにおける「成功」の基準の1つは、リストの階層が破棄されるのではなく保持されることです。
私はこれが3年前であることを知っていますが、Office 2010には、Microsoftコードを追加せずに「フィルターされたHTML」として保存するオプションがあります。
Webページを保存するか、Microsoft WordでHTML形式の電子メールメッセージを送信すると、追加のタグが追加されるため、Wordのすべての機能を引き続き使用してコンテンツを編集できます。
HTML形式のWebページと電子メールメッセージのサイズを縮小するには、それらをフィルター処理されたHTMLで保存して、Microsoft Officeプログラムで使用されているタグを削除します。
この機能は、HTMLファイルに表示されるタグに関心のある経験豊富なWeb作成者にのみお勧めします。
フィルターされたHTMLで保存したWordでWebページを再度開くと、テキストと一般的な外観は保持されますが、特定のWord機能を通常の方法で使用してファイルを編集できない場合があります。たとえば、箇条書きまたは番号付きリストの外観は保持されます。ただし、リストに関連付けられているWordの機能の一部は保持されません。
可能であれば、Wordでページの編集が終了したときにのみ、フィルタリングされたHTMLでWebページを保存する必要があります。ただし、Webページの基になるHTMLが重要でない場合は、ファイルを標準のWebページとして保存する必要があります。
後でファイルを編集する必要がある場合は、2つのファイルを維持できます。1つはWord形式で、もう1つはフィルター処理されたHTML形式です。 Word文書のコンテンツを編集し、将来の編集のためにWord形式で保存してから、フィルターされたHTML形式でコピーを保存できます。
LibreOffice などの別のアプリケーションを仲介としていつでも使用でき、それを使用してHTMLドキュメントとして保存できます。
LibreOffice(以前は OpenOffice で、必要に応じて引き続き使用できます)は、比較的きれいなコードを生成します。
私はこれをやってからしばらく経ちましたが、Google DocのHTMLへのエクスポートはMS Wordよりもうまく機能し、Google DocsはWord docsを読むと信じているので、Google Docそのようにエクスポートします。
これにはいくつかの良い答えがあります Word HTMLをクリーンアップする最良の無料の方法は何ですか?
HTMLTidy が上に出てくる
WordドキュメントをRTF形式で保存してから、HTMLにエクスポートしてみてください。 RTF文書に、Word文書に必要な複雑さがすべて含まれておらず、よりシンプルなHTMLにつながることを願っています。