web-dev-qa-db-ja.com

なりすましやソーシャルエンジニアリング攻撃を検出するための、視覚的に類似した文字のリスト

私は ホモグラフ攻撃 や、攻撃者が信頼できるドメイン名(たとえば、bankofthewest.comではなくbankofthevvest.com)に視覚的に類似したスプーフィングドメイン名を使用する他の攻撃を検出しようとしています。

プログラムでの使用に適した視覚的に類似した文字の辞書またはデータベースはありますか?

たとえば、「l」を検索した場合、「l」が「1」および「i」に視覚的に類似していることを示すリストを取得したいと思います(少なくとも一部のフォントでは)。 「w」を調べると、「vv」(フォントによっては)と視覚的に似ていることがわかる場合があります。 「d」を検索すると、「cl」(一部のフォント)と視覚的に類似していることがわかります。少なくとも今のところ、ASCII文字間の視覚的な類似性に焦点を当てています。Unicodeを無視しても問題ありません(ただし、視覚的にどのUnicode文字が認識されているかを知っているリストがある場合、それは特別なボーナスです)各ASCII文字と同様)。

そのようなものがすでに存在しているのであれば、ホイールの再発明を避けたいと思います。そのようなリストはすでに存在していますか?

これが私がこれまでに見つけたものです:

22
D.W.

「ホモグラフ」の代わりに「ホモグリフ」という用語で調べてみてください。

たとえば、これはあなたが望むものかもしれません:

https://codebox.net/pages/homoglyph-detection

コードと辞書が含まれています。

9
J Kimball