.pdf
ファイルを.odt
ファイルに変換して、.doc
ファイルにさらに変換できるようにします。これを実行できるソフトウェア/スクリプトはありますか? .pdf
ファイルのコンテンツをコピーして、フォーマットが保持されないliberofficeライターに貼り付けようとしました。
ドキュメントは機密情報ですので、変換にはオンラインサービスを使用しないことをお勧めします。
どんな助けも大歓迎です。
無料のPDF to ODTコンバーターが不足していることに悩まされました。複雑なものさえ必要ありませんでした。 LibreOfficeで注釈を付けることができるODTファイルを生成するツール(たとえば、フォームに記入するため)。
PDFドキュメントをグラフィックファイルに変換してLibreOfficeにインポートすることで、これを手動で行う方法を知っていますが、非常に手間がかかります。
それで、私は最終的に、必要なすべてのステップを自動的に実行する簡単な小さなシェルスクリプトを作成しました。 https://github.com/gutschke/pdf2odt で見つけることができます
任意の数のPDFおよび画像ファイルを入力として受け取り、LibreOfficeで開いて編集できるODTファイルを生成します。画像はページの背景として表示されるため、自由に上書きできます。各画像は、独自のページスタイルに関連付けられています。改ページを挿入するときは、そのことを念頭に置いて、必要に応じてページスタイルを調整してください。
LinuxとMacの両方でスクリプトをテストしました。適度に標準的なツールをほんの一握り必要とするだけであるため、非常に移植性が高いはずです。
pdftotextを含むPDF Utilities
(Synapticまたはapt-getを介したpoppler-utils)を見ることができます。
Popplerは、Xpdf PDFビューアーに基づくPDFレンダリングライブラリです。
このパッケージには、PDFドキュメントの情報を取得したり、他の形式に変換したり、操作したりするためのコマンドラインユーティリティ(Popplerベース)が含まれています。
* pdfdetach-埋め込みファイル(添付ファイル)をリストまたは抽出します
* pdffonts-フォントアナライザー
* pdfimages-画像抽出
* pdfinfo-ドキュメント情報
* pdfseparate-ページ抽出ツール
* pdftocairo-PDF Cairoを使用したPNG/JPEG/PDF/PS/EPS/SVGコンバーター
* pdftohtml-PDFからHTMLへのコンバーター
* pdftoppm-PDFからPPM/PNG/JPEG画像コンバーター
* pdftops-PDFからPostScript(PS)へのコンバーター
* pdftotext-テキスト抽出
* pdfunite-ドキュメントマージツール
もちろん、成功はpdfファイルがどのように生成されたかに依存します。テキストファイルとして欲しいものが得られたら、that.odtファイルとして。
編集:引用のソースを提供するのを忘れました。 PDF Utilities (based on Poppler).
のSynapticの説明タブから
LibreOfficeは.pdf
ファイルをインポートできます。最良の結果を得るには、LibreOfficeの現在のバージョンで単に開いてください。ただし、ドキュメントは図面として開かれ、Writerドキュメントとしてではなく、サポートされている画像形式の1つにのみ変換できます。
当然、すべての書式設定が保持されるわけではありませんが、少なくとも一部は保持されます。
Calibreをお試しください。 htmlに変換してから、他の形式に変換します。それがなければ印刷しなければならなかった大きな(183ページ)ファイルでかなり良い仕事をしました。
私の場合、私はそれをepubに変換しましたが、楽しみのために.docxに変換しただけで非常にうまくいきました。
poppler-utilsパッケージがインストールされている場合、以下のNautilusスクリプト( 〜/ .gnome2/nautilus-scriptsフォルダーに実行可能ファイルとして配置することで)PDFファイルをHTMLに変換するのに役立ちます(オプション「-i」を削除して画像を含めることもできます)。 BeLibreOffice Writerで開き、ODTとして保存しますが、フォーマット変換の成功はPDFの作成方法に大きく依存します。