PDFがあり、そのPDFで利用可能なメタデータを取得したいとします。どのユーティリティを使用すればよいですか?
私が通常最も知りたい情報は 用紙サイズ であり、PDF視聴者が通常報告しないものです。例:PDFサイズのレター、合法、A4または何か他?利用可能な他の情報も興味深いかもしれません。
このための標準的なツールの1つはpdfinfo
です。出力例:
[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator: TeX
Producer: pdfTeX-1.40.14
CreationDate: Sun May 18 09:53:06 2014
ModDate: Sun May 18 09:53:06 2014
Tagged: no
Form: none
Pages: 1
Encrypted: no
Page size: 595.276 x 841.89 pts (A4)
Page rot: 0
File size: 19700 bytes
Optimized: no
PDF version: 1.5
調べる価値のあるもう1つのユーティリティは exiftool です。ドキュメントのジオメトリに関する情報を報告しないため、特定のケースでは適切なツールではない可能性がありますが、一般的に、これはおそらく、最も機能が充実したツールであり、PDFメタデータを検査します。
次に、使用可能なすべてのメタ情報(-a
)をグループ(-G1
)で並べ替えて出力するコマンドの例を示します。
exiftool -a -G1 "$File"
公式ドキュメントには、サポートされているPDF関連のタグの概要が記載されています。
あなたはDebian/Ubuntuにexiftoolをインストールすることができます:
Sudo apt-get install libimage-exiftool-Perl
GUIの側面に詳しい場合は、私のプロジェクト PDFMtEd を試してみてください。これは、exiftoolのグラフィカルフロントエンドとして機能し、メタデータの表示と編集を可能にするツールのセットですPDFメタデータ。
ここにいくつかのスクリーンショットがあります: