スキャンした古いPDFがたくさんあり、ディスクのスペースを取りすぎています。
私はウェブ上で利用可能な多くのPDFコンプレッサーを試しました。それらはすべて、カラー画像に使用する圧縮と単色画像に使用するものを尋ねますが、すべてを変換するものが見つかりませんでした。バイナリイメージに。
バイナリとは、各ピクセルがフルブラックまたはフルホワイトの2つのカラー値のうちの1つしか持てないことを意味します。すべてのPDFに白黒のテキスト(グレースケールさえも含まない)があることを知っています。一部のツール(WindowsまたはLinuxまたはAndroid)は、この知識を使用してより良い圧縮を実現できますか?
よくわかりませんが、Adobe AcrobatProの「PDFを最適化」ツールでうまくいくかもしれません。ただし、そうだとしても、より安価でコンパクトなアプリケーションについて知りたいと思います。
jbig2圧縮は、ファイルサイズを縮小するための最良の方法です
Adam Langleyは、もともとgooglebooks用にjbig2encエンコーダーを作成しました
その後、ソースコードをリリースして、誰でもビルドできるようにしました
もちろん、以下のプリコンパイル済みバイナリを使用することもできます。
Jbig2enc + akrykukovパッチ
thessalonica-pdf.py thessalonica-pdf.pyも必要です
jbig2encの一般的な構文は次のとおりです(ファイルがtiffであると仮定)
jbig2 -s -p -v *.tiff && pdf.py output >out.pdf
ただし、Jbig2enc + akrykukovパッチの場合
jbig2 -s -p -v -P (number of pages for dictionary) *.tiff && thessalonica-pdf.py *.jbig2 >out.pdf
すべてのjbig2の結果ファイルを収集してPDFにまとめるには、python libsが必要です。