web-dev-qa-db-ja.com

ファイルからすべてのメタデータを削除する方法(a.s. pdf)

プライバシーの問題のために、ドキュメントからすべてのメタデータを削除したい(例(pdfjpgdocx、…)。メタデータは一般に、次のような実際のコンテンツとは別に格納される追加情報です。

  • 使用ソフトウェア
  • 使用中のオペレーティングシステム
  • 時間と時々場所
  • カメラモデル、使用ギア...(写真、 Exif を参照)

pdfjpgからすべてのメタデータを確実に削除するにはどうすればよいですか? docxなど?」

2
Suuuehgi

マット

MATMetadata Anonymisation Toolkit)をご覧ください!それは TOR -peopleから来ており、 Tails —の標準として、プライバシーと匿名性を重視したライブOSです。

exiftoolの一種のラッパーなので、より多くのファイルをサポートしています formats that exiftool alone。

今では、それらは:

  • ポータブルネットワークグラフィックス(.png)
  • JPEG(.jpg、.jpeg、…)
  • TIFF(.tif、tiff、…)
  • ドキュメントを開く(.odt、.odx、.ods、…)
  • Office OpenXml(.docx、.pptx、.xlsx、…)
  • Portable Document Fileformat(.pdf)
  • テープアーカイブ(.tar、.tar.bz2、…)
  • MPEG AUdio(.mp3、.mp2、.mp1、…)
  • Ogg Vorbis(.ogg、…)
  • 無料のロスレスオーディオコーデック(.flac)
  • トレント(.torrent)

詳細については、 this paperをご覧ください。

気をつけて

「Matはファイルから標準のメタデータのみを削除し、notは削除します:

  • コンテンツを匿名化する
  • 透かしを処理する
  • ハンドル ステガノグラフィ
  • 過度にカスタマイズされたメタデータフィールド/システム(→jpg、Zip)

本当に匿名にしたい場合は、メタデータを含まない形式を使用するか、より良い方法として、プレーンテキストを使用します。

そして最も重要なことは、注意してください:すべての形式に透かしを入れることができ、プレーンテキスト(例:SNOWプロジェクト)でさえも!

また、ドキュメントのコピーを印刷して再スキャンし、MATに渡すこともできます。ただし、印刷物を安全に細断し、プリンター/スキャナーのメモリに痕跡を残さないように注意してください。」( MAT-website から取得)

JPEG

コメントと標準のExif-/IPTC-/XMP-tagsは削除されています。独自の非標準タグ(Canon Rawタグなど)が存在する可能性があります。これらは、たとえば独自のRAW→JPEG変換ツール。

郵便番号

MATは、アーカイブの内容を変更しません。ツールがアーカイブ内にメタデータを含む追加ファイルを作成する場合、それらは変更されません。

Installation

Ubuntu 12.10以降

Ubuntu 12.10以降は、標準リポジトリuniverseにあります。

Sudo aptインストールマット

Ubuntu 12.10以下

古いバージョンのUbuntuの場合、手動でインストールする必要があります。依存関係は次のとおりです。

  • gir1.2-poppler-0.18
  • libimage-exiftool-Perl(ユニバース)
  • python2.7
  • python-gi-cairo
  • python-mutagen
  • python-pdfrw(ユニバース)

以下を介してインストールします。

Sudo apt-get install gir1.2-poppler-0.18 libimage-exiftool-Perl python2.7 python-gi-cairo python-mutagen python-pdfrw

次にMAT here を取得します(例:mat-0.6.1.tar.xz)。 GnuPG でダウンロードを確認する場合は、.ascファイルも取得します。

それを確認するには、ページの下部にあるキーをインポートします。経由で

gpg --search-keys 0x04D041E8171901CC

そして確認してください:

gpg --verify mat-0.6.1.tar.xz.asc  mat-0.6.1.tar.xz

出力は次のようになります

gpg: Signature made Sun 03 Jan 2016 09:02:29 PM CET using RSA key ID 171901CC
gpg: Good signature from "Julien (jvoisin) Voisin <[email protected]>" [unknown]
gpg:                 aka "Julien (jvoisin) Voisin <[email protected]>" [unknown]
gpg:                 aka "Julien (jvoisin) Voisin <[email protected]>" [unknown]
gpg: WARNING: This key is not certified with a trusted signature!
gpg:          There is no indication that the signature belongs to the owner.
Primary key fingerprint: 9FCD EE9E 1A38 1F31 1EA6  2A74 04D0 41E8 1719 01CC

解凍してインストールする

tar xvfJ mat-0.6.1.tar.xz
cd mat-0.6.1
Sudo python2 setup.py install

Debianユーザーは、testing-repoで見つけ、Archユーザーは AUR で見つけます。

すべてがうまくいった場合、コンソールツールmatとGUI mat-guiがあります。

5
Suuuehgi