web-dev-qa-db-ja.com

PDFファイルから透かしを削除する方法

これは簡単な作業だと思いましたが、それは反対の結果になりました。

透かしは、すべての単一ページでまったく同じ(重なり合っているが透明な)画像です。私は自分でPDFファイルを作成しました(だからここでは著作権の心配はありません)PDFCreator 0.9.8を使っています。

友達のAdobe Acrobat Proを試してみましたが、うまくいきませんでした。それを削除しようとしますが、できません。ヘッダー/フッターなどを削除しようとしましたが、透かしが消えないだけです。

透かしを削除するにはどうすればよいですか。

41
Shiki

画像ベースの透かしの場合、それらの自動削除を約束するツールがいくつかあります。例えば:

これらはすべて試してみるのは自由ですが、実際に望ましい出力を生成するにはライセンスが必要です。

ただし、この特定のPDFファイルの透かし(OPから電子メールで送られてきたもの)は、すべてのページで繰り返される単一の画像ではありません。結局のところ、PDFCreatorはそれをそれらの一つ一つに(ほぼピクセル毎に)ハードコードした。これは透かしを削除することをはるかに困難にします(そして、結果としてかなり肥大化したPDFファイルになります)。

透かしは実際にはたくさんの小さな画像で構成されているので、PDFエディタ(例: Foxit Advanced PDF Editor )で簡単に選択できます。それらを押して Delete。残念ながら、あなたはすべてのページに対してこれを繰り返さなければなりません。

時間がかからない解決策は、透かしをプログラムで削除することです。必要なもの:

ステップ

  1. Pdftkをダウンロードして、pdftk.exeおよびlibiconv2.dllから%windir%\ System32、パス内のディレクトリまたは任意の場所に展開します。選択。

  2. Notepad ++をダウンロードしてインストールします。

  3. PDFストリームは通常 DEFLATE アルゴリズムを使用して圧縮されます。これはスペースを節約しますが、それはPDFのソースを読みにくくします。

    コマンド

    pdftk original.pdf output uncompressed.pdf uncompress
    

    すべてのストリームを解凍するので、テキストエディタで変更できます。

  4. 透かしの構造を明らかにするためにNotepad ++でncompressed.pdfを開いてください。

    この特定のケースでは、すべてのページはブロックで始まります

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    そしてこれとほぼ同じ4,000ブロック。この特定のブロックは、透かしのピクセルのうち1つのみ(/W 1 /H 1)を設定します。

    パターンが変わるまで下にスクロールすると、透かしのストリームの長さは95,906バイトです(改行を数える)。まったく同じストリームがPDFファイルのすべてのページで繰り返されます。

  5. 押す Ctrl + H 次のように設定します。

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    正規表現q 9 0 0 9 2997 4118\.67 cm.{95881}は、上記ブロックの最初の行(q 9 0 0 9 2997 4118.67 cm)とそれに続く95,881文字すべて、つまり透かしのストリームと一致します。

    すべて置換をクリックすると、PDFファイルのすべてのページから削除されます。

  6. 透かしは削除されましたが、PDFファイルにエラーがあり(ストリームの長さが正しくありません)、圧縮されていません。

    コマンド

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    両方の面倒を見る.

  7. [uncompressed.pdfは必要なくなりました。あなたはそれを削除することができます。

結果は、透かしのない(およびサイズの約半分)同じPDFです。

73
Dennis

透かしは実際には.PDF内の画像の一部であり、.PDFを表示するために使用しているものによってその上にレンダリングされた個別の画像ではないようです。 .PDFから画像を抽出し、それらを画像エディタで実行してから手動で.PDFを再構築しないと、透かしを削除できない場合があります。

6
LawrenceC

テキスト透かしの場合は、PostScriptバージョンを編集する方がはるかに簡単です。

$ pdftops document.pdf

document.psを編集してから、PDFに変換し直します。

$ ps2pdf document.ps

4
heiner

それをする別の方法を見つけました:

  1. pdf2htmlEXツール(または他の任意のPDF to HTMLコンバータ)を使用してPDFをHTMLファイルに変換。
  2. テキストエディタでHTMLを編集し、透かしを削除します。それを保存。
  3. 新しいPDFドキュメントにHTMLに印刷する
  4. 利益
1
Dominik Antal

スタンプのアーティファクトはAdobe Acrobat Pro内でそれを削除できるということですが、ストリームオブジェクトはそれを永続的に保つのでマウスの動きで再生成されます。

あなたがpdfソースを編集しようとすると - これはトリッキーですが、ファイルが破損する可能性があります。

スタンプがストリームの場合は、コンピュータをネットから切断することで中断できます。

次に、Adobe Acrobat Proを使用して、自分の注釈の1つを選択し、右クリックしてポップアップを表示して、[コメント一覧の表示]を選択しました。

リストから不正な透かし/スタンプを選択し、ポップアップを表示するために右クリックして「削除」を選択します。貼り付けが行われるすべてのページでこれを行います。

ファイルを別の名前で保存します。私のアプリケーションはクラッシュしましたが、ファイルを保存する前ではありませんでした。

新しいファイルを開きます。すべての透かし/切手はハメ撮りです。

私の場合、私の3ページの文書のファイルサイズは300 kbから印象的な60 kbに縮小しました。元のデータと注釈はすべてそのまま残りました - 透かしは含まれていません。

〜グッドハンティング:o)

1
Alan Hord

zamzarを使用して文書を.rtfファイルに変換します。変換後、ウォーターマークは自動的に消えます。 注意してください。 - 文書にテキスト素材が含まれている場合は完全に機能します。それは常に大きな助けになりました..(Macユーザー)

1
Shifa

これは2012年7月30日の18:06の@Dennisの答えに対する補足です。彼は確かに難しいケースに対処します。

たとえば、透かしがシンプルで、手付かずのテキストである最も単純な場合

Smedley For Commissioner

圧縮されていないPDF透かしは、次のように定義されます。

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

この特定の透かしインスタンスの75.96は水平方向のオフセット、625は垂直方向のオフセットです。 (はい、実数と整数の両方が見られるかもしれません。)

次のような正規表現はそのような透かしすべてに有効ですが、配置のバリエーションは無視されます。

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

さまざまな修正PDF演算子が、より複雑なフォーマットを持つ透かしを使用すると効果があることに注意してください。このような空想は、読者が期待していること(期待していること)を、連続した、検索が簡単な文字列に変換することができます。例えば、

E1 Smedley™による=mc²

この製品かもしれません:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

。 。 。あなたの透かしが色強調されている場合やはるかに悪い!

これらすべてに注目したので、PDFtkには4ドルのライセンス料を考慮して透かしを処理することを目的としたGUIバージョンがあることにも気づくでしょう。まったく高価ではありません!

一方で、私はそのウェブサイトがWindows 8OS X 10.8 Mountain Lionを通してO/Sの完全なサポートを現在宣伝しているのを見つけます。そのヴィンテージは4年以上前です。 PDFtkが古くなっているのでしょうか。私はそうは思わないが、私は知らない。

0
Der Schley

ここに 無料と有料の方法 があります。Googleドライブを使用することをお勧めします。

Googleドライブにはファイルを開いたり、ちょっとした編集をしたりする機能があります。また、PDF onlineから透かしを削除するためにも使用できます。

  1. Googleドライブアカウントを開きます。これは基本的にGmailアカウントと同じです。
  2. [新規]> [ファイルのアップロード]をクリックし、PDFドキュメントを選択してからアップロードします。
  3. 完了したら、ドライブにアップロードされたファイルを確認してから、右クリックして「Google Docs」で開くことができます。
  4. その後、あなたの透かしは自動的に削除されます。保存するには、[ファイル]から[名前を付けてダウンロード]をクリックし、[PDF文書]を選択します。
0
Crystal Wang