web-dev-qa-db-ja.com

重複した写真を見つけるにはどうすればよいですか?

サイズ変更された写真など、重複した写真を見つけるために何を使用できますか?

70
ændrük

digiKamInstall via the software center

すべての写真をコレクションに追加します。メニューで、「ツール/重複の検索」を選択します。これにより、コレクション全体で重複が検索されます。

findimagedupesInstall via the software center

コマンドラインツール。比較するすべての画像をコマンドラインで渡します。

Geeqie (以前の GQviewInstall via the software center

メニューで、「ファイル/重複の検索」を選択します。画像ファイルをドラッグアンドドロップして複製ウィンドウを作成します。ディレクトリを削除して、その内容を再帰的に追加できます。画像を視覚的に比較するために、ドロップダウンメニューに特定のデフォルト以外のオプションがあります。 「カスタム」レベルの類似性では、ペアリングを最高の類似度のみに制限できますが、「Preferences」で99に設定する必要があります。それでも、少なくとも一部の種類の画像、たとえばアート。残念ながら、解像度、日付などの合理的な基準を備えた自動選択メカニズムは提供されません。自動選択は、保存する参照として見つかった最初の画像をランダムに選択するようです。多くの画像を削除すると、削除のたびに結果カウントを更新しようとするため、非常に遅くなる可能性があります。


これらの3つのツールはすべて、バイトごとに同一のファイルだけでなく、視覚的な重複を検出します。

57
Gilles

FSlintInstall FSlint

fslintは、md5sumによって任意のタイプの重複ファイルを見つけることができるグラフィカルプログラムです。画像が同一でない場合、重複としてフラグは付けられません。以下の画像は、ダウンロードディレクトリにある多数の重複したPDFファイルを示しています。

enter image description here

高度な検索パラメーターを変更して、ファイルタイプで検索し、画像のみに制限することができます。これは、findコマンドオプションとして「追加の検索パラメーター」を変更することで実行されます。たとえば、ここでは*.jpgファイルのみを探しています(同じパスで、「ダウンロード」フォルダーのみを探しています:

enter image description here

fdupesInstall fdupes

fdupesは、同等のコマンドラインベースのツールです。どちらもリポジトリで入手できます。

22
jozzas

fdupesInstall fdupes

fdupesというコマンドラインツールを使用して、重複ファイルを見つけることができます(詳細については、man fdupesを参照してください)。サイズが変更された「重複」を見つける方法がわかりません。これを行うプログラムには、画像のサイズを変更するとデータが変更されるため、従来の重複検索方法が機能しないため、画像コンテンツを分析する何らかのインテリジェントなアルゴリズムが必要です。

7
dv3500ea

imgSeekInstall imgseek

imgSeek は、重複する写真と同様の写真を見つけることができるため(サイズ変更された写真や、異なるファイル名とメタデータを持つ写真を見つけることができるはずです)、スケッチに基づいて写真を検索することもできます。デスクトップおよびサーバーバージョンで利用できます。

しかし、実際に自分で試したことはありません。

6
david.libremone

dupeGuru Picture Edition 絶対に素晴らしい作品であり、試してみる価値があります。

これらには Launchpad PPAdupeguru(新しいオールインワンパッケージ)またはdupeguru-pe(古い画像版パッケージ)があり、これらのコマンドを使用してインストールできます。

Sudo add-apt-repository ppa:hsoft/ppa
Sudo apt-get update
Sudo apt-get install dupeguru
4
tuxflo

Visipics

Visipicsはその機能に対応した無料のWindowsアプリケーションですが、Linuxではもちろんワインでも問題なく動作します(複製のソートに関してはgeeqie/gqviewよりも優れています(geeqieの結果は絶対に「ソート不可」です)。

ファイルサイズの縮小、非圧縮タイプ、低解像度などの基準に基づいて画像を自動選択するように指示することができます(ただし、逆は行いません。手動で行う必要がありますgeeqieで行うよりもはるかに優れていますが、選択範囲を保持する必要がない点が異なります Shift/Ctrl)、さらにはフォルダに優先順位を付けます(ただし、最後の優先順位はフォルダの優先順位です)。

ただし、シンボリックリンクに注意する必要があります。実際のファイルを「コピー」として削除しながら、シンボリックリンクをファイルに「ランダムに」選択して保存できます。残念です。

2
the dsc