web-dev-qa-db-ja.com

重複するハッシュを見つける

私はたくさんのファイル(4800ファイル)を持っていますが、それは多くの重複とトリプルを含んでいると思います。問題は、それらも同じ名前を持っていないということです。私はすでに同じ名前の簡単なものを取り除きました。ファイルはすべて狭い範囲のサイズであるため、役に立ちません。

スクリプトを実行してディレクトリ内のすべてのファイルのハッシュをチェックし、重複したハッシュを報告できるのではないかと思いました。誰もがそのようなことを達成する方法を知っていますか?

LinuxとWindowsで実行できます。

ありがとう

1
Dr.Ping

これは、(指定されたディレクトリ内の)すべてのファイルをハッシュして結果をCSVファイルに出力するPowershellコマンドです。

Get-FileHash -Algorithm MD5 -Path (Get-ChildItem "\\Path\to\files\*.*" -Recurse) | Export-Csv C:\Temp\hashes.csv

その後、ExcelでCSVファイルを開き、重複を根絶することができます。

「Get-FileHash」コマンドレットは、Powershellバージョン4以降でのみ使用できることに注意してください。

2
Charles Burge