web-dev-qa-db-ja.com

PDFに関するメタデータの発見

PDFがあり、そのPDFで利用可能なメタデータを取得したいとします。どのユーティリティを使用すればよいですか?

私が通常最も知りたい情報は 用紙サイズ であり、PDF視聴者が通常報告しないものです。例:PDFサイズのレター、合法、A4または何か他?利用可能な他の情報も興味深いかもしれません。

40
Faheem Mitha

このための標準的なツールの1つはpdfinfoです。出力例:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5
48
Ulrich Schwarz

調べる価値のあるもう1つのユーティリティは exiftool です。ドキュメントのジオメトリに関する情報を報告しないため、特定のケースでは適切なツールではない可能性がありますが、一般的に、これはおそらく、最も機能が充実したツールであり、PDFメタデータを検査します。

次に、使用可能なすべてのメタ情報(-a)をグループ(-G1)で並べ替えて出力するコマンドの例を示します。

exiftool -a -G1 "$File"

公式ドキュメントには、サポートされているPDF関連のタグの概要が記載されています。

あなたはDebian/Ubuntuにexiftoolをインストールすることができます:

Sudo apt-get install libimage-exiftool-Perl

GUIの側面に詳しい場合は、私のプロジェクト PDFMtEd を試してみてください。これは、exiftoolのグラフィカルフロントエンドとして機能し、メタデータの表示と編集を可能にするツールのセットですPDFメタデータ。

ここにいくつかのスクリーンショットがあります:

enter image description here

enter image description here

19
Glutanimate