Shotwellが多くの画像を2回インポートしたことに気付きました(たとえば、カメラのSDカードから)。どうやら 重複検出にはバグがあります 写真がインポートされ、タグが付けられ、再インポートされると。
設定で「メタデータタグの書き込み」を有効にしています。写真をインポートしてtest-images.jpg
にタグを追加すると、同じファイルの別のインポート時に重複検出によって写真がnotピックアップされます。ファイルが2回インポートされると、test-images-1.jpg
という名前が付けられ、アクティブルールに従ってライブラリフォルダーに配置されます(必ずしも同じフォルダーにある必要はありません)。
test-images.jpg
とtest-images-1.jpg
は同じ画像データを持ちますが、タグ/メタデータが追加されたため、ファイルは同じではなくなり、重複(md5ハッシュなど)を検索しても取得されません。
複数の重複を引き起こした私の使用シナリオは次のとおりです。
重複をクリーンアップする方法は?ファイル名ベースの検索を使用することは可能ですが、-1
で終わるファイルをインポートしていないことを除外することはできません複製としてインポートされなかったもの。
フォトライブラリをクリーンアップするにはどうすればよいですか? Shotwellで検索機能を使用しようとしましたが、1000枚以上の写真があれば、より簡単で、信頼性が高く、エラーが少なくなります。
タグが失われることを心配する必要はありません。通常、2番目のインポート(複製)にはタグが適用されていません。
スパムのようなものですが、数か月前に同じ問題を抱えていることに気付き、それを行う小さなユーティリティを作成しました。
https://github.com/jesjimher/imgdupes
これは、ディレクトリツリーをスキャンして重複を探すpythonスクリプトです。構文は意図的にfdupesに似ていますが、imgdupesはすべてのメタデータを無視し、JPEGファイルの画像データチャンクのみを分析するという違いがあります。つまり、物理ファイルが異なる場合でも、タグ、回転フラグ、日付などが異なる同じイメージの2つの異なるバージョンが重複として報告されます(したがって、fdupes/shotwellによって重複として検出されません)。
最近jpegdupesに名前が変更され、現在はPypiリポジトリにあるため、複製された画像のツリーをスキャンするには次のようにします。
Sudo pip install jpegdupes jpegdupes -d ~/Photos/
(またはパスは何でも)
実際には同じ画像(メタデータのみが異なる)であるJPEGを探し、インタラクティブに違いを示し、どのバージョンを保持するかを尋ねます。
それが役に立てば幸い。
数週間前に同じ問題に遭遇しました。この問題を解決するために私が見つけた解決策は基本的ですが機能します。Shotwell内で、タグが付いていない、ファイル名が「_1.jpg」で終わるすべての画像を表示する新しい保存済み検索を作成します。その後、この検索のためにShotwellによってリストされたすべてのファイルを消去できますが、注意してください、前にバックアップを作成してください;-)私の場合、2000以上の写真を削除しました!
同じ問題にぶつかり、すべての画像をShotwellから別のフォルダーにエクスポートすることで解決しました。たとえあなたがダップしていても、Shotwellはそれらを一度だけ表示します。たとえば、フォルダ内に64Kがありましたが、Shotwellには32Kしか表示されませんでした。したがって、すべてを選択し、サイズ、名前、メタデータなどを保持してエクスポートしました。唯一の欠点は、複雑なフォルダ構造があり、それを保持したい場合-このソリューションはうまくいかない可能性があります。今、すべてを1つのフォルダーに入れています。ところで、このバグは現在修正されているようです。
タグ付けされたファイルを携帯電話にコピーして戻すことができますので、もう違いはありませんか? Shotwellは独自のタグ付けに対応する必要があると思いますが、これはバグのように見えます。同様の問題がありますが、Shotwellを実行するたびにCamera Rawファイルを再開発しています。