LinuxシステムでMicrosoft Word(.doc
)ファイルを読み取るにはどうすればよいですか? .doc
ファイルはサポートされていません。私は試した
strings filename.doc | less
しかし、醜い出力を出します。他のオプションはありますか?
私はGUIベースのツールを好みます。
グラフィカルなソリューションが必要な場合は、 Open Office または Libre Office でそれらを開くことができる場合があります。
アンチワード もあります
Antiwordは、LinuxおよびRISC OS用の無料のMS Wordリーダーです。 FreeBSD、BeOS、OS/2、Mac OS X、Amiga、VMS、NetWare、Plan9、EPOC、Zaurus PDA、MorphOS、Tru64/OSF、Minix、SolarisおよびDOSへのポートがあります。 Antiwordは、バイナリファイルをWord 2、6、7、97、2000、2002、および2003からプレーンテキストおよびPostScriptに変換します。
catdoc -
CatdocはMS Wordファイルデコードツールで、ファイルのフォーマットを分析することはしません(読み取り可能なテキストを抽出するだけです)が、Wordのすべてのバージョンを処理し、文字エンコーディングを変換できます。
そして、言及された他のいくつかのオプション here (linux.com)。
私は docx2txt をリストに追加します-呪われた新しい.docx
形式(Late $ t $ tandardtm)。
私は Abiword がLinuxでWordファイルを処理することに長けていることを発見しました。書式設定は常に Libre Office (ブロックの大きな男の子とメインの賭け)に近いわけではありませんが、通常、実行される内容は、よりクリーンで使いやすい形式になります。
私は通常、オンラインのときにこれらに遭遇します。 Firefoxまたはその継子の1つを使用している場合は、 Docs Online Viewerプラグイン をお勧めします。処理できるドキュメントの種類の横に小さな目玉アイコンが表示されます。見るために眼球をクリックするだけです。
処理対象:「PDF、DOC、DOCX、XLS、PPT、RTF、ODT、ODS、ODP、CSV、その他多くのフォーマット」
Chromeバージョンがありますが、使用していません。
無料の MS Word Viewerwine で実行してみてください。