OpenDocument をHTMLまたはマークダウンに変換できる フリーソフトウェア を探しています。
Pandoc HTMLをOpenDocumentに変換できますが、その逆はできません。
odt2html.pypip
とeasy_install
の両方を使用したインストールに失敗しました。
LibreOffice 伝えられるところによると変換を行うことができます。ただし、次のコマンドでは機能しませんでした。
soffice --convert-to --outdir . htm:HTML my.odt
--convert-to
を使用していますが、その値を指定していません。
正しい構文は次のとおりです。
soffice --headless --convert-to htm:HTML --outdir . my.odt
または、使用してみてください 次のスクリプト :
#! /bin/bash
CONFIG=/path/to/tidy_options.conf
# rm -rv "$2"
mkdir -p "$2"
for F in `find $1 -type f -name "*.doc" -or -name "*.odt"`; do
BASE=`basename $F .doc` ; BASE=`basename $BASE .odt`
soffice --headless --convert-to htm:HTML --outdir $2 $F
tidy -q -config $CONFIG -f $2/$BASE.err -i $2/$BASE.htm | sed 's/ class="c[0-9]*"//g' > $2/$BASE.html
done
使用法:
$ convert_doc_to_html.sh SOURCE_DIR TARGET_DIR
見る:
オープンソースのユニバーサルドキュメントコンバータである pandoc の新しいバージョンが機能するようになりました。
pandoc -t html -s input.odt -s -o output.html