web-dev-qa-db-ja.com

PDFドキュメント内のスペース使用量を分析する方法は?

私は65枚のスキャンされた白黒画像から作成したこの7mbpdfを持っています。 OCR後、ドキュメントは32MBになります。

テキストがこれほど多くのスペースを占めるのを見たことがありません。 (理論的には、25MBで2500万文字が非圧縮になります)プレーンテキストで保存すると、約4KB /ページ* 65 = +/- 280KBのテキストがあります。

検索可能な画像を作成するので、残りの32MBを配置用に残しますか?ありそうもない。

何かがおかしいようで、PDFのさまざまな部分が占めるスペースを確認したいのですが、これを実行しているように見えるツールが見つかりません。

編集:問題のPDFの問題は解決されました。犯人は検索可能な画像 vs 検索可能な画像(正確)を持っていました。それはそれらをはるかに大きくしたいくつかの画像をリサンプリングしたに違いありません。しかし、まだ質問への答えに興味があります。

5
ufotds

探しているツールは、AdobeAcrobatのAuditSpaceUsageツールです。このツールは、PDFのどのコンポーネントがファイルサイズに貢献しているかのバイトごとの内訳を提供します。

これが 監査スペース使用量ツールを見つける方法を示すビデオ です。何らかの理由で、AdobeはそれをAcrobatに隠しました。

この機能は、ファイル>名前を付けて保存...>最適化>スペース使用量の監査にあります。

3
Rowan