COMオブジェクトを使用せずに、Word(2003および2007)ファイルをPython)で読み書きすることはできますか?
私はできることを知っています:
f = open('c:\file.doc', "w")
f.write(text)
f.close()
しかし、Wordはネイティブの.docファイルではなく、HTMLファイルとして読み取ります。
私は IronPython を調べます。これは、.NETランタイムで実行されるため、本質的にWindows/Office APIにアクセスできます。
python-docx を参照してください。公式ドキュメントは こちら にあります。
これは私にとって非常にうまくいきました。
何を読むだけかは、Linuxのsofficeコマンドを使用してテキストに変換し、テキストをpythonにロードすることは simplest です。
doc(この場合はWord 2003)とdocx(Word 2007)は異なる形式です。後者は通常、xmlファイルと画像ファイルのアーカイブにすぎません。これらのxmlファイルの内容を操作することにより、docxファイルに書き込むことが非常に可能であると想像します。ただし、なんらかの種類のCOMコンポーネントインターフェイスなしでdocファイルを読み書きする方法はわかりません。