私の問題は、640ページのPDFファイルから画像を抽出することです。
その大部分はテキスト付きのチャートとテーブルです。単純なコピーと貼り付けを行うと、画像の解像度が失われ、テキストがぼやけ、場合によっては判読できなくなります。
解像度に影響を与えずにPDFファイルから画像を抽出するためのより良い方法を知っていますか?
XPDFスイートから (無料でオープンソースのソフトウェアです)pdfimages.exe
CLIツールを使用して、PDFからすべての画像を抽出するか、ページの範囲からすべての画像を抽出します。 33〜36ページからすべての画像を抽出する例を次に示します。
pdfimages.exe ^
-f 33 ^
-l 36 ^
-j ^
c:/path/to/input.pdf ^
c:/path/to/directory/input_images
-j
は、埋め込まれたJPEG画像をJPEGとして抽出しようとします。他のすべての画像はPPM(ポータブルピクスマップ)として出力されます。注意、PPMは完全に非圧縮です!
これは、Ubuntuでevince
(ドキュメントビューア)を使用すると非常に簡単です。 evince
を使用してPDFを開き、ウィンドウを最大化せずにマークしますAlways on top
次にドラッグアンドドロップ好きなフォルダに画像を入れます。
フォトショップ! PhotoshopでPDFを開きます。(Windows 7でPhotoshop CCを使用)
元の解像度の画像の抽出は、Solid Framework SDKの無料機能の1つであるため、C#でソリューションを作成する場合、これは次のようになります。 http://www.soliddocuments.com/features.htm?product=SolidFramework
この機能を説明するサンプルアプリケーションは、GUIバッチソリューションが必要な場合も無料です。 http://www.pdf-internals.com/download.htm?product=SolidPDFMechanic
(私はソリッドドキュメントを使用しています)
(1)ファイルをWord 2013で開くことができます([ファイル]-[開く]を使用)。ここで画像をコピーできます。解像度は印刷には十分ですが、オリジナルと同じかどうかはわかりません。
(2)フリーウェアビューアSumatraPDF(LaTeXを使用している場合は非常に便利です)右にあるときに[画像をコピー]メニューオプションがあります-画像をクリックします。解像度は維持されると思います(ただし、画像をコピーできないファイルを見たことがあります)。
(3)Adobe Acrobat XのFileの下にSave as Other-Imageがあり、デフォルトでは高解像度を使用しています(私が試した場合)元の解像度でした)。
(4)Perlには複数の方法があります。たとえば、read here と特に言及 何かからJPEG画像を抽出するプログラム 、これは私にとって完璧に機能し、元の解像度のJPEG画像を確実に抽出します。
Imagemagick を使用して、すべてのPDFページを個別の画像ファイルに変換することができます(ただし、そのような大きなドキュメントを実行するのにどれくらい時間がかかるか、または埋め込まれた画像の解像度が必要なものに適しているかどうかがわかるので、これで試してみる価値があるかもしれません。
Acrobat Proを使用している場合、これが高解像度のスナップショットを撮る最も簡単な方法です(必要な高さに設定します)。設定/全般で、「スナップショットツールに固定解像度を使用する」というボックスをオンにして、解像度を好きなように設定します(例:300ppi以上)。次に、スナップショット(ツール/選択&ズーム/スナップショットツール)を取得すると、高解像度のコピーがクリップボードにコピーされます。次に、クリップボードから必要な場所に貼り付けます。よく働く。
より詳細な説明を表示するには、このリンクをクリックしてください...
私は通常、Adobe IllustratorでPDFファイルを開いて画像を抽出し、それをコピーしてInDesignに貼り付けます。解像度は保持されます。
最善の方法は、Adobe Acrobat Pro(2010以降のバージョン)を使用することです。 [ファイル]-> [名前を付けて保存]-> [その他のオプション]-> [カプセル化されたPostScript]に移動し、[保存]をクリックします。
Macでは、プレビューから画像またはページ全体をエクスポートして、完全な解像度を得ることができます。ダイアログで希望する解像度を尋ねられます。
いいえ-コピーと貼り付けは、埋め込まれたリソースの元の解像度を維持する必要があります-最も可能性が高いのは、PDF内で縮小されたのは低解像度の画像であるため、エクスポートすると、実際よりも見た目が悪くなります。
縮小するか、PDFの場合と同じサイズにしてください。実際には同じサイズにする必要があります。
または、(そして最悪のオプション)100%ズームに移動してスクリーンショットを撮るか、Windows Vista/Windows 7のスニッピングツールを使用します。
注-.PDF
sの画像は通常、.PDF
に変換された時点で縮小/圧縮されますが、一度圧縮されると、同じ品質で抽出できるはずです。 PDF
、悪くはありません。
PDF使用している表示ソフトウェアはどれですか?
Adobe Acrobat Pro のようなPDFediting/creationプログラムを使用することにより、 PDFファイル*)にある埋め込み画像をそのまま抽出できます。Adobeのサイト(WindowsおよびMacの場合)から無料の試用版を入手できます。無料で試用できます。
*それらが保護されていない限り、そうする必要があります..ええ、私はそこに行きません...
Adobe Acrobat Pro
[ファイル]> [名前を付けて保存]は、[編集]> [設定]の下にあるConvert-From-PDF設定を使用します
[PDFから変換]では、ファイル形式ごとに[設定の編集...]が許可されます
最良のものは、PDFの作成に使用されたソース画像と解像度に依存します。
しかし、ロスレスTIFF設定を編集することでかなり良い結果を得ることができます
解像度を1200以上に設定し(保存に失敗した場合は低く設定します)、元のファイル>名前を付けて保存を使用してPDFファイルを高解像度の個別ファイルにレンダリングします
最善の方法ではありませんが、別のドキュメントタイプとしてレンダリングするよりもはるかに優れています。
ファイルは非常に大きくなりますが、カットアンドペーストに適しています
Adobe InDesignでは、「配置」コマンドを使用してPDFファイルをインポートできます。特定のページをインポートする場合は、ダイアログをクリックした後に表示されるダイアログで[インポートオプションの表示]チェックボックスをオンにします配置コマンド。高解像度の画像として必要なものがページに収まるように、フレームをドラッグしてサイズを変更します。多くの場合、画像のアスペクト比に応じてドキュメントのページサイズをサイズ変更する必要があります。表示内容に満足したら、 [エクスポート]コマンドを使用して、[高品質PDF]を選択します。これにより、高解像度が作成されますPDFこれは、印刷またはLatexドキュメントで使用できます。