タイトルはそれをすべて言います。メディアライブラリで重複を検出するにはどうすればよいですか?
dupeGuru Music Edition はあなたが望むものです。環境設定でスキャンタイプを「オーディオコンテンツ」に設定します。プログラムはフェアウェアですので、できれば貢献してください。
これを MusicBrainz Picard と組み合わせると、音楽ファイルに自動的にタグを付けることができます。
このために少し前に作成されたプラグインがあります。私は最近それを使用しましたが、まだ少し残っています。 「 PPA 」がありますが、まだビルドされたパッケージはなく、Bazaarブランチのみです。インストール手順は次のようになります。
wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz
Bazaar'dのソースコードを使用することに興味がある場合は、代わりに以下を実行します。
mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source
インストールが完了したら、Rhythmboxを再起動すると、プラグインリストにDuplicates Finderが表示されます。
アクティブ化した後、追加の構成オプションが利用可能になります。
プラグインが有効になった後、および重複が見つかった場合、ライブラリリストに追加オプションを追加します。
「奇数」として見つけたいくつかの設定-120,000曲以上(1,000を超える複製)のメディアライブラリと、約1,000曲と30の複製を含むライブラリでこれを試しました。前者では検索に非常に長い時間がかかり、Rhythmboxが数回クラッシュしました。最終的に、リストを再構築する必要を避けるために、自動的に「ライブラリから削除」を使用しました。小さいライブラリではすべてがうまく機能します。
重複が見つかった場合-デフォルトのオプションが選択されている場合-曲の低品質バージョンがリストに追加されます。そのため、重複リストですべての曲を選択し、「削除」(ディスクから削除するかライブラリから削除する)をしても安全です。
そのために fdupes を使用できます。
$ fdupes -r ~/Music
すべての重複ファイルのリストが表示されます。
簡単にインストールできます
Sudo apt-get install fdupes
重複する画像ファイルがたくさんあるときに、同様の問題に遭遇しました。私の場合、ファイルでmd5sum
を使用し、結果をソートしました。
for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort
同じ内容のファイルは同じハッシュを生成したため、重複を簡単に見つけることができました。私はそこから重複を手動で削除しましたが、スクリプトを拡張して最初の発生以外をすべて削除することもできましたが、アドホックスクリプトでそれを行うことは常に妄想です。
これはidenticalの内容の重複ファイルに対してのみ機能することに注意してください。
FSlintまたはdude gredtterを試してください
インストールするにはFSlintターミナルに入力(Ctrl-Alt-T)
Sudo apt-get install fslint
これが役立つことを願っています。