PDFまたはHTML + CSSをDOCまたはLinuxではDOCXに変換する必要があります。これは、コマンドラインまたはスクリプト言語から行うことができます。
何か案が?
コマンドラインからOpenOfficeを使用して後者を実行できる場合があります。スクリプト言語の架け橋もあります。詳細については、OpenOfficeのWebサイトを参照してください。 PHP call [〜#〜] puno [〜#〜] )用のものがありますが、私はまだ個人的な経験がありません。
OpenOfficeマクロを使用してHTMLを.docに変換できます。次のスレッドを参照してください。
http://www.oooforum.org/forum/viewtopic.phtml?p=44367#44367
PDF-スキャンされたテキストなどにPDFが使用されることが非常に多いため、pdfを.docに変換するのははるかに困難です。
pdftohtml
を使用して、PDFからHTMLファイルを作成できます。
Wordはhtmlファイルを直接開くことができます。
私はちょうどこの質問に出くわしました、そしてもう少しグーグルした後、pandocを見つけました: http://johnmacfarlane.net/pandoc/README.html
簡単なコマンドは、次のようにhtml入力からdocxまたはpdf(またはrtfなど)ファイルを作成します。
pandoc -o output.docx input.html
また、stdout(一部の形式)に書き込んだり、stdinから読み取ったりすることもできます。
それがdebian/ubuntuリポジトリにあるかどうかはわかりませんが、Redhat/CentOS6のepel6リポジトリにあります(yum install pandoc
)。
これが誰かに役立つことを願っています:)