web-dev-qa-db-ja.com

pdfファイルをodtファイルに変換する方法は?

.pdfファイルを.odtファイルに変換して、.docファイルにさらに変換できるようにします。これを実行できるソフトウェア/スクリプトはありますか? .pdfファイルのコンテンツをコピーして、フォーマットが保持されないliberofficeライターに貼り付けようとしました。

ドキュメントは機密情報ですので、変換にはオンラインサービスを使用しないことをお勧めします。

どんな助けも大歓迎です。

32
Ankit

無料のPDF to ODTコンバーターが不足していることに悩まされました。複雑なものさえ必要ありませんでした。 LibreOfficeで注釈を付けることができるODTファイルを生成するツール(たとえば、フォームに記入するため)。

PDFドキュメントをグラフィックファイルに変換してLibreOfficeにインポートすることで、これを手動で行う方法を知っていますが、非常に手間がかかります。

それで、私は最終的に、必要なすべてのステップを自動的に実行する簡単な小さなシェルスクリプトを作成しました。 https://github.com/gutschke/pdf2odt で見つけることができます

任意の数のPDFおよび画像ファイルを入力として受け取り、LibreOfficeで開いて編集できるODTファイルを生成します。画像はページの背景として表示されるため、自由に上書きできます。各画像は、独自のページスタイルに関連付けられています。改ページを挿入するときは、そのことを念頭に置いて、必要に応じてページスタイルを調整してください。

LinuxとMacの両方でスクリプトをテストしました。適度に標準的なツールをほんの一握り必要とするだけであるため、非常に移植性が高いはずです。

15
gutschke

pdftotextを含むPDF Utilities(Synapticまたはapt-getを介したpoppler-utils)を見ることができます。

Popplerは、Xpdf PDFビューアーに基づくPDFレンダリングライブラリです。

このパッケージには、PDFドキュメントの情報を取得したり、他の形式に変換したり、操作したりするためのコマンドラインユーティリティ(Popplerベース)が含まれています。
* pdfdetach-埋め込みファイル(添付ファイル)をリストまたは抽出します
* pdffonts-フォントアナライザー
* pdfimages-画像抽出
* pdfinfo-ドキュメント情報
* pdfseparate-ページ抽出ツール
* pdftocairo-PDF Cairoを使用したPNG/JPEG/PDF/PS/EPS/SVGコンバーター
* pdftohtml-PDFからHTMLへのコンバーター
* pdftoppm-PDFからPPM/PNG/JPEG画像コンバーター
* pdftops-PDFからPostScript(PS)へのコンバーター
* pdftotext-テキスト抽出
* pdfunite-ドキュメントマージツール

もちろん、成功はpdfファイルがどのように生成されたかに依存します。テキストファイルとして欲しいものが得られたら、that.odtファイルとして。

編集:引用のソースを提供するのを忘れました。 PDF Utilities (based on Poppler).のSynapticの説明タブから

13
user25656

LibreOfficeは.pdfファイルをインポートできます。最良の結果を得るには、LibreOfficeの現在のバージョンで単に開いてください。ただし、ドキュメントは図面として開かれ、Writerドキュメントとしてではなく、サポートされている画像形式の1つにのみ変換できます。

当然、すべての書式設定が保持されるわけではありませんが、少なくとも一部は保持されます。

10
bender

Calibreをお試しください。 htmlに変換してから、他の形式に変換します。それがなければ印刷しなければならなかった大きな(183ページ)ファイルでかなり良い仕事をしました。

私の場合、私はそれをepubに変換しましたが、楽しみのために.docxに変換しただけで非常にうまくいきました。

3
Christopher

poppler-utilsパッケージがインストールされている場合、以下のNautilusスクリプト( 〜/ .gnome2/nautilus-scriptsフォルダーに実行可能ファイルとして配置することで)PDFファイルをHTMLに変換するのに役立ちます(オプション「-i」を削除して画像を含めることもできます)。 BeLibreOffice Writerで開き、ODTとして保存しますが、フォーマット変換の成功はPDFの作成方法に大きく依存します。

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym

3
Sadi