プライバシーの問題のために、ドキュメントからすべてのメタデータを削除したい(例(pdf、jpg、docx、…)。メタデータは一般に、次のような実際のコンテンツとは別に格納される追加情報です。
「pdf、jpgからすべてのメタデータを確実に削除するにはどうすればよいですか? docxなど?」
MAT (Metadata Anonymisation Toolkit)をご覧ください!それは TOR -peopleから来ており、 Tails —の標準として、プライバシーと匿名性を重視したライブOSです。
exiftool
の一種のラッパーなので、より多くのファイルをサポートしています formats that exiftool
alone。
今では、それらは:
詳細については、 this paperをご覧ください。
「Matはファイルから標準のメタデータのみを削除し、notは削除します:
- コンテンツを匿名化する
- 透かしを処理する
- ハンドル ステガノグラフィ
- 過度にカスタマイズされたメタデータフィールド/システム(→jpg、Zip)
本当に匿名にしたい場合は、メタデータを含まない形式を使用するか、より良い方法として、プレーンテキストを使用します。
そして最も重要なことは、注意してください:すべての形式に透かしを入れることができ、プレーンテキスト(例:SNOWプロジェクト)でさえも!
また、ドキュメントのコピーを印刷して再スキャンし、MATに渡すこともできます。ただし、印刷物を安全に細断し、プリンター/スキャナーのメモリに痕跡を残さないように注意してください。」( MAT-website から取得)
コメントと標準のExif-/IPTC-/XMP-tagsは削除されています。独自の非標準タグ(Canon Rawタグなど)が存在する可能性があります。これらは、たとえば独自のRAW→JPEG変換ツール。
MATは、アーカイブの内容を変更しません。ツールがアーカイブ内にメタデータを含む追加ファイルを作成する場合、それらは変更されません。
Ubuntu 12.10以降は、標準リポジトリuniverseにあります。
Sudo aptインストールマット
古いバージョンのUbuntuの場合、手動でインストールする必要があります。依存関係は次のとおりです。
以下を介してインストールします。
Sudo apt-get install gir1.2-poppler-0.18 libimage-exiftool-Perl python2.7 python-gi-cairo python-mutagen python-pdfrw
次にMAT here を取得します(例:mat-0.6.1.tar.xz)。 GnuPG でダウンロードを確認する場合は、.ascファイルも取得します。
それを確認するには、ページの下部にあるキーをインポートします。経由で
gpg --search-keys 0x04D041E8171901CC
そして確認してください:
gpg --verify mat-0.6.1.tar.xz.asc mat-0.6.1.tar.xz
出力は次のようになります
gpg: Signature made Sun 03 Jan 2016 09:02:29 PM CET using RSA key ID 171901CC
gpg: Good signature from "Julien (jvoisin) Voisin <[email protected]>" [unknown]
gpg: aka "Julien (jvoisin) Voisin <[email protected]>" [unknown]
gpg: aka "Julien (jvoisin) Voisin <[email protected]>" [unknown]
gpg: WARNING: This key is not certified with a trusted signature!
gpg: There is no indication that the signature belongs to the owner.
Primary key fingerprint: 9FCD EE9E 1A38 1F31 1EA6 2A74 04D0 41E8 1719 01CC
解凍してインストールする
tar xvfJ mat-0.6.1.tar.xz
cd mat-0.6.1
Sudo python2 setup.py install
Debianユーザーは、testing-repoで見つけ、Archユーザーは AUR で見つけます。
すべてがうまくいった場合、コンソールツールmat
とGUI mat-gui
があります。