web-dev-qa-db-ja.com

スキャンしたPDFを圧縮されたPDFバイナリ(2レベル)画像付き)に変換する

スキャンした古いPDFがたくさんあり、ディスクのスペースを取りすぎています。

私はウェブ上で利用可能な多くのPDFコンプレッサーを試しました。それらはすべて、カラー画像に使用する圧縮と単色画像に使用するものを尋ねますが、すべてを変換するものが見つかりませんでした。バイナリイメージに。

バイナリとは、各ピクセルがフルブラックまたはフルホワイトの2つのカラー値のうちの1つしか持てないことを意味します。すべてのPDFに白黒のテキスト(グレースケールさえも含まない)があることを知っています。一部のツール(WindowsまたはLinuxまたはAndroid)は、この知識を使用してより良い圧縮を実現できますか?

よくわかりませんが、Adobe AcrobatProの「PDFを最適化」ツールでうまくいくかもしれません。ただし、そうだとしても、より安価でコンパクトなアプリケーションについて知りたいと思います。

2
Abhishek Anand

jbig2圧縮は、ファイルサイズを縮小するための最良の方法です

Adam Langleyは、もともとgooglebooks用にjbig2encエンコーダーを作成しました

その後、ソースコードをリリースして、誰でもビルドできるようにしました

もちろん、以下のプリコンパイル済みバイナリを使用することもできます。

Jbig2enc + akrykukovパッチ

jbig2encの一般的な構文は次のとおりです(ファイルがtiffであると仮定)

jbig2 -s -p -v *.tiff && pdf.py output >out.pdf

ただし、Jbig2enc + akrykukovパッチの場合

jbig2 -s -p -v -P (number of pages for dictionary) *.tiff && thessalonica-pdf.py *.jbig2 >out.pdf

重要:

すべてのjbig2の結果ファイルを収集してPDFにまとめるには、python libsが必要です。

4
Dingo