膨大な音楽コレクションがあり、そこにいくつかの複製があります。重複ファイルを見つける方法はありますか。少なくとも、ハッシュを実行し、2つのファイルが同じハッシュを持っているかどうかを確認します。
拡張子を除いて同じ名前のファイルを見つけることのボーナスポイント-mp3とoggの両方のバージョンの曲がいくつかあると思います。
それが最も簡単な方法であれば、コマンドラインを使用してうれしいです。
これにはfdupes
を使用します。 Sudo apt install fdupes
を使用してリポジトリからインストールできるコマンドラインプログラムです。 fdupes -r /dir/ect/ory
のように呼び出すと、重複のリストが出力されます。 fdupesには simple Homepage と Wikipediaの記事 もあり、さらにいくつかのプログラムがリストされています。
FSlint にはGUIとその他の機能があります。 FAQからの重複チェックアルゴリズムの説明:
1. exclude files with unique lengths
2. handle files that are hardlinked to each other
3. exclude files with unique md5(first_4k(file))
4. exclude files with unique md5(whole file)
5. exclude files with unique sha1(whole file) (in case of md5 collisions).
programs/scripts/bash-solutions
のリスト。重複を見つけてnix
:の下で実行できます。
重複排除タスクが音楽に関連している場合は、最初に picard アプリケーションを実行して、音楽を正しく識別してタグ付けします(名前が間違っていても重複する.mp3/.oggファイルを見つけるため)。 picardはUbuntuパッケージとしても利用できることに注意してください。
musicip_puid
タグに基づいて、重複したすべての曲を簡単に見つけることができます。
このジョブを実行する別のスクリプトは、 rmdupe です。著者のページから:
rmdupeは、標準のLinuxコマンドを使用して、ファイル名や拡張子に関係なく、指定されたフォルダー内で重複ファイルを検索します。重複する候補が削除される前に、バイトごとに比較されます。 rmdupeは、1つまたは複数の参照フォルダーに対して重複をチェックしたり、ファイルを削除する代わりにゴミ箱に入れたり、カスタムの削除コマンドを許可したり、指定したサイズのファイルに検索を制限したりできます。 rmdupeには、実際にファイルを削除せずに特定のコマンドに対して実行されることを報告するシミュレーションモードが含まれています。
やってみました
finddup
または
finddup -l
私はそれがうまくいくと思います。
音楽関連の重複識別と削除の場合、PicardとJaikozによる http://musicbrainz.org/ が最適なソリューションです。 Jaikozは、曲ファイルのデータに基づいて音楽に自動的にタグを付けると考えています。曲を識別し、すべてのメタデータを割り当てるために、曲の名前さえ必要ありません。無料版では1回の実行でタグ付けできる曲の数には制限がありますが、必要な回数だけタグを実行できます。
komparator -Sudo apt-get install komparator
( buntu 10.04 + )-手動モードで重複を見つけるためのGUIツールとして使用します。