Htmlをdocまたはdocxに変換しようとしています。利用可能なphpクラスのいくつかを使用しましたが、結果は良くありません。 LibreOfficeやOpenOfficeなどのオフィスソフトウェアを使用してhtmlファイルをdocに変換できるかどうか疑問に思いますか?
LibreOffice(AbiWord)は、htmlをdocファイルに「変換」しますが、フォーマットは行いません。 docファイルを開くとhtmlソースコードが表示されます。
abiword --plugin AbiCommand
convert /home/qqq/test/test.htm /home/qqq/test/test.doc doc
そしてopenOfficeでは何も起こりません..:
soffice --headless --convert-to doc:DOC /home/qqq/test/test.htm
コンソールに戻るには、ctrl + cを押す必要があります。
HTMLをドキュメントに変換する方法はありますか?これら2つのアプリのデスクトップバージョンでhtmlを開いてドキュメントとして保存できますが、コンソールバージョンでは機能しないようです。
これは非常に遅い応答ですが、それが少数の人々に役立つことを願っています。
LibreOfficeはフィルターを利用します
以下のコード例(たとえば、HTMLからPDFへの変換)では、-infilter = writerglobal8_HTMLや:writer_web_pdf_Exportなどの2番目のオプションの引数に気付くでしょう。
soffice --headless --infilter=writerglobal8_HTML --convert-to pdf:writer_web_pdf_Export --outdir /SomeFolder/Output /SomeFolder/Example.html
これらは「フィルター」として知られています。これは、個々のファイルタイプのサブカテゴリに相当します。たとえば、.docはMicrosoft Office95ドキュメントまたは2003ドキュメントである可能性があります。それは基本的にLibreOfficeにファイルがどのフォーマットであるかについての手がかりを与えます。
フィルタには、inフィルタ(基本的には「受信ファイルのサブフォーマット」)とoutフィルタ(送信ファイルのフォーマットIEエクスポート、ファイル入力))の2種類があります。 。
あなたの場合、有効なDOCフィルターが含まれます(スペースが含まれている場合、引用符を使用する必要がありますが、引用符が機能しないことがよくあるため、マイレージが異なる場合があります):
MS WinWord 5
MS WinWord 6.0
MS Word 2003 XML
MS Word 2007 XML
MS Word 2007 XML Template
MS Word 2007 XML VBA
MS Word 95
MS Word 95 Vorlage
MS Word 97
MS Word 97 Vorlage
MS_Works
MS_Write
LibreOfficeが提供する(ややまとまりのない).ODSシートからいくつかのファイルフィルターを作成できます ここ 。
これはばかげた解決策かもしれませんし、私が使用しているHTMLファイルのいくつかの詳細に特有のものかもしれませんが、ファイルの名前を。docx拡張子で変更してみてください。私はそれらを「Word」ファイルとして開くことができ、その後保存それらをWordファイルとして開くことができました。