web-dev-qa-db-ja.com

重複に近いテキストを見つけるためのExcel2013ファジールックアップ

ほぼ重複しているキャプションのリストがあります。例えば:

  • 彼女の誕生日
  • 彼女の誕生日のために
  • 誕生日-彼女のために
  • 彼女/誕生日のために

私はこれらのほぼ重複を強調する方法としてファジールックアップを調べていました

5
Tim

私はこれらのほぼ重複を強調する方法としてファジールックアップを調べていました

Excel用のあいまい検索アドインは、Excelのテキストデータのあいまい一致を実行します。


Excel用のファジールックアップアドイン

Excel用のあいまい検索アドインはMicrosoftResearchによって開発され、MicrosoftExcelでテキストデータのあいまい一致を実行します。

1つのテーブル内の重複するファジー行を識別したり、2つの異なるテーブル間で類似した行をファジー結合したりするために使用できます。マッチングは、スペルミス、略語、同義語、追加/欠落データなど、さまざまなエラーに対して堅牢です。

たとえば、行「Mr.アンドリューヒル」、「ヒル、アンドリューR.」 「AndyHill」はすべて同じ基になるエンティティを参照し、各一致とともに類似スコアを返します。

デフォルトの構成は、製品名や顧客の住所など、さまざまなテキストデータに適していますが、特定のドメインや言語に合わせてマッチングをカスタマイズすることもできます。

ソース Excel用ファジールックアップアドイン


類似性しきい値の構成に関する提案はありますか?

Excelでファジールックアップを実行する 類似性しきい値の構成に関するヒントがいくつかあります。

3
DavidPostill