web-dev-qa-db-ja.com

類似のファイル(重複ではない)を見つける方法はありますか?

私の最終的な目標は、同僚​​が書いたコードをリファクタリングすることです。それで、ほんの数語で異なるファイルを見つけることができるツールはありますか?

(編集:これはMac用ですが、他の人もMac以外の回答を好むかもしれません。)

12
tig

Simian 一部の言語のソースコードに対してこれを行います。露骨なコピーアンドペーストコーディングを見つけるのに最適です。その開発は行き詰まっているようですが、十分に機能します。

5

(Windowsの場合)

製品 Anti-Twin (私的使用は無料) クレーム これを実行できるようにする:

Anti-Twinで完全な重複を検索するだけでなく、類似のファイルも検索する場合は、必要な最小一致をデフォルト値の100%から最大60%に減らすことができます。この機能は、細部のみが変更されたほぼ同一のファイルを検索するために特別に設計されています。 Anti-Twinは、100%未満の値を入力するとすぐに、類似性検索を使用します。類似性の比較は、100%完全重複検索よりもはるかに時間がかかります。

残念ながら、バイトごとの比較の一部としての類似性検索は、ファイルが圧縮および暗号化されていない場合にのみ類似性を検出できるため、いくつかのファイルタイプに対してのみ意味があります。非圧縮ファイルは、例えば書式なしテキスト(.TXT)およびHTML。

2
harrymc