web-dev-qa-db-ja.com

HTMLファイルをWordに変換する方法は?

HTMLドキュメントをWord .DOCファイルとしてメモリに保存する必要があるという要件があります。

誰かが私にこれを行うために使用できるクローズドソースライブラリとオープンソースライブラリの両方へのリンクを教えてもらえますか?

また、選択肢を絞り込むために、この質問を編集して、使用している言語を追加する必要があります。

ありがとう!

35
Mask

pandoc を使用してみてください

pandoc -f html -t docx -o output.docx input.html

入力または出力形式が明示的に指定されていない場合、pandocは入力および出力ファイル名の拡張子から推測しようとします。
— pandocマニュアル

だからあなたも使用することができます

pandoc -o output.docx input.html
30
Jan

あなたのphpページの先頭でこれを過ぎてください。これに関するコードがトップコードになる前に。

<?php
header("Content-Type: application/vnd.ms-Word"); 
header("Expires: 0"); 
header("Cache-Control: must-revalidate, post-check=0, pre-check=0"); 
header("content-disposition: attachment;filename=Hawala.doc");

?>

これにより、すべてのhtmlがMSWORDに変換されます。クライアントの要件に応じてカスタマイズできます。

5
SAR

これを行うとき、私はそれが最も簡単であることがわかりました:

  1. Webブラウザーでページにアクセスします
  2. Webブラウザーを使用して.htm拡張子(およびサポートファイルのあるフォルダー)を使用してページを保存します
  3. Wordを起動し、保存されたhtmファイルを開きます(Wordはそれを正しく開きます)
  4. 必要に応じて編集します
  5. [名前を付けて保存]を選択し、doc、docxなどの拡張子を選択します。
4
SnapShot

適切なオプションは、 Docverter のようなAPIを使用することです。 Docverterでは、APIを使用してHTMLをPDFまたはDOCXに変換できます。

4
user1980965

ファイルの名前を.doc .....に変更する以外の方法.

http://msdn.Microsoft.com/en-us/library/Microsoft.office.interop.Word(office.11​​).aspx

ここから始めるのが良い場所です。このOffice Open XMLを使用して試すこともできます。

http://www.ecma-international.org/publications/standards/Ecma-376.htm

1
sleath