PDF文書を読み取ってデコードできるアプリケーションをコーディングしたい。ここで、このファイル形式の仕様を取得することになっていますか? PDF形式はISOグループから標準化されていますが、この種の情報を取得するための最も信頼できるソースがどこにあるかは私にはわかりません。
このファイル形式から始めるのに適したソースは何ですか?
あなたは実際にあなたが言及した両方のソースを使用することができます。混乱は歴史的です。
AdobeはPDFを発明し、それと共に使用するAcrobat製品ファミリーを発明しました。異なるPDFバージョンが、主要なAcrobatバージョンと一緒にリリースされました(PDF 1.3 for例はAcrobat 4とともにリリースされました。
PDFフォーマットの採用と、独自のPDFファイルフォーマットに実際に依存する多くのISO標準が作成されたため( ISO標準)、アドビはPDFフォーマットをISOに渡すことを決定しました。
その時点から今日まで、PDF仕様の編集と新しいバージョンの作成を担当するISO委員会があります。PDFのISO標準はISOです32000。
また、PDFを使用する場所によっては、他の多くのISO標準が非常に有用または不可欠な場合があることにも注意してください。 PDF/X(PDFファイルの交換用)とPDF/A(PDFファイルの作成用)これらの仕様は、特定のバージョンのPDF標準)を参照し、追加の要件と制限を追加します。
仕様に関する限り、すべてのドキュメントをISOから直接取得できます。ただし、PDF自体については、Adobeから入手することもでき、そのドキュメントは同じです。AcrobatのAdobe DevNetサイトを参照してください。
http://www.Adobe.com/devnet/acrobat.html
Acrobat SDKをダウンロードするだけで、その一部としてドキュメントが提供されます。
「PDF仕様のターゲット設定」に関する注意事項をコードに追加します。本当に、本当に、本当に必要なものをより明確に指定することをお勧めしますPDF(編集、生成、品質管理(プリフライト))次に、これらのニーズを満たすか、ニーズに合わせて拡張できる既存のライブラリを探すか、質問します。
一般に「PDF」をサポートする何かを書くことは困難な作業になります。 PDF仕様は大きく、複雑で、たくさんあります...まあ...素敵です。ドラゴンがいる!
更新:
AdobeのPDF-1.7仕様ドキュメントへの直接リンク(初版、無料でダウンロードできます)は次のとおりです。
このドキュメントの内容は、後に、一般的なPDFのISO標準であるISO 32000-1として正式に採用されました。
ただし、ISOから入手できるPDFファイルにはいくつかの違いがあります:
PDFソフトウェアを開発し始めたら、(無料)PDF上記のAdobeリンクから入手できれば十分です。
PDFは軽量形式ではありません。これは基本的には圧縮されたポストスクリプトです。既存のライブラリは間違いなく使用したいものであり、独自のライブラリを作成するのではありません。それは大きな仕事です。
または、既存のPDFライターアプリケーションを取得し、プログラム内から起動します。
私はあまり見ていませんが、 libgnupdf は問題ありません。
Wikipedia によるとPDFは3つのテクノロジーを組み合わせたものです。
- レイアウトとグラフィックスを生成するためのPostScriptページ記述プログラミング言語のサブセット。
- フォントがドキュメントとともに移動できるようにするフォント埋め込み/置換システム。
- これらの要素と関連コンテンツを単一のファイルにバンドルする構造化ストレージシステム。必要に応じてデータを圧縮します。