web-dev-qa-db-ja.com

Wordテンプレート(* .dotファイル)をプレーンテキストに変換するには、どのCLIアプリケーションを使用すればよいですか?

Microsoft Wordテンプレートファイルがいくつかあります。彼らは持っている - *.dot拡張子:

$ file file.dot
file.dot: Composite Document File V2 Document, Little Endian, Os: Windows, 
Version 6.1, Code page: 1252, Author: user, Template: file.dot, Last Saved By: 
user, Revision Number: 2, Name of Creating Application: Microsoft Office Word, 
Total Editing Time: 01:00, Last Printed: Tue Nov 21 14:41:00 1995, Create
Time/Date: Fri Dec 20 11:46:00 2019, Last Saved Time/Date: Fri Dec 20 11:46:00 
2019, Number of Pages: 3, Number of Words: 300, Number of Characters: 1713,
Security: 0

いくつかのCLIアプリケーションを使用してそれらをプレーンテキストに変換する必要があります。

出来ますか?

6
N0rbert

antiword(使用 deb-package )もあり、古い(XML以前の)Word文書からプレーンテキストを非常に効率的に抽出しますが、常に完全に正しいわけではありません。

7
Simon Richter

ターミナルでLibreOfficeを使用できます。

soffice --headless --convert-to txt:Text YOUR-DOCUMENT-HERE.DOT

ソースをチェックしてください
Source1
Source2

15
Sam