web-dev-qa-db-ja.com

OpenOfficeまたはLibreOfficeでhtmlをdoc / docxに変換する方法は?

Htmlをdocまたはdocxに変換しようとしています。利用可能なphpクラスのいくつかを使用しましたが、結果は良くありません。 LibreOfficeやOpenOfficeなどのオフィスソフトウェアを使用してhtmlファイルをdocに変換できるかどうか疑問に思いますか?

LibreOffice(AbiWord)は、htmlをdocファイルに「変換」しますが、フォーマットは行いません。 docファイルを開くとhtmlソースコードが表示されます。

abiword --plugin AbiCommand
convert /home/qqq/test/test.htm /home/qqq/test/test.doc doc

そしてopenOfficeでは何も起こりません..:

soffice --headless --convert-to doc:DOC  /home/qqq/test/test.htm

コンソールに戻るには、ctrl + cを押す必要があります。

HTMLをドキュメントに変換する方法はありますか?これら2つのアプリのデスクトップバージョンでhtmlを開いてドキュメントとして保存できますが、コンソールバージョンでは機能しないようです。

2
MilMike

これは非常に遅い応答ですが、それが少数の人々に役立つことを願っています。

LibreOfficeはフィルターを利用します

以下のコード例(たとえば、HTMLからPDFへの変換)では、-infilter = writerglobal8_HTMLや:writer_web_pdf_Exportなどの2番目のオプションの引数に気付くでしょう。

soffice --headless --infilter=writerglobal8_HTML  --convert-to pdf:writer_web_pdf_Export --outdir /SomeFolder/Output /SomeFolder/Example.html

これらは「フィルター」として知られています。これは、個々のファイルタイプのサブカテゴリに相当します。たとえば、.docはMicrosoft Office95ドキュメントまたは2003ドキュメントである可能性があります。それは基本的にLibreOfficeにファイルがどのフォーマットであるかについての手がかりを与えます。

フィルタには、inフィルタ(基本的には「受信ファイルのサブフォーマット」)とoutフィルタ(送信ファイルのフォーマットIEエクスポート、ファイル入力))の2種類があります。 。

あなたの場合、有効なDOCフィルターが含まれます(スペースが含まれている場合、引用符を使用する必要がありますが、引用符が機能しないことがよくあるため、マイレージが異なる場合があります):

MS WinWord 5
MS WinWord 6.0
MS Word 2003 XML      
MS Word 2007 XML      
MS Word 2007 XML Template      
MS Word 2007 XML VBA      
MS Word 95      
MS Word 95 Vorlage      
MS Word 97      
MS Word 97 Vorlage      
MS_Works      
MS_Write

LibreOfficeが提供する(ややまとまりのない).ODSシートからいくつかのファイルフィルターを作成できます ここ

1
SSight3

これはばかげた解決策かもしれませんし、私が使用しているHTMLファイルのいくつかの詳細に特有のものかもしれませんが、ファイルの名前を。docx拡張子で変更してみてください。私はそれらを「Word」ファイルとして開くことができ、その後保存それらをWordファイルとして開くことができました。

0
AdamO