不正検出のための100%の解決策がないことは知っていますが、少なくともこの使用例にある程度の信頼を設定したいと思います。
次のようなシステムがあるとします。
詐欺を回避するために4つのステップを実行しています(たとえば、偽のアカウントからの複数の投稿)。
ステップ1-各アカウントは、製品ごとに1つの投票のみを許可します。
- 悪意のあるユーザーは、レビューを偽造するために複数のアカウントを作成する必要があります。
- 新しいアカウントを作成するには、新しいメールが必要です。
- 彼はグーグルrecaptchaを完了する必要があります
ステップ2-この組み合わせが真の場合、無効なレビュー:
- 選択した会社の製品には、ユーザーIP +ユーザーのブラウザー指紋の組み合わせがすでに存在しています(ブラウザーの指紋の衝突を回避するためにIPを使用しています)
ステップ-この組み合わせが真の場合、無効なレビュー:
- 過去2日間に選択した会社の製品に使用されたのと同じユーザーIP
ステップ4-すべてが失敗した場合、ユーザーはレビューを投稿できます。
- モデレート領域で、同じ製品に重複した指紋がある場合、レビューは偽造の可能性があるものとしてマークされ、それに応じて承認が必要になります
不正検出のこのメカニズムを改善する簡単な方法はありますか?
指紋の衝突に関するアドバイスはありますか?
ユーザーに「私が持っているもの」の2要素認証を使用させることをお勧めします。 1つの例は、登録または投稿時にユーザーを確認するためにテキストメッセージを送信することです。
または、アカウントが新しく、「待機時間」がある場合、顧客が投稿できる機能を制限します。
さらに進んで、レビューが配置されているエリア内に人がいるかどうかをチェックするモバイルアプリで地理位置情報を要求できます。
2番目のステップは、会社/製品ごとに1時間あたりのレビュー数を制限することです。
繰り返しますが、これはすべて実装が簡単ではなく、顧客の負担が大きくなります。
悪意のあるユーザーは、自分のブラウザの指紋を変更することができます。少なくとも、彼は自分のマシンに2つ以上の異なるブラウザをインストールすることができます。さらに、同じIPアドレス(NATの背後など)を使用している、または共有のホームコンピューターを使用している複数のユーザーについてはどうでしょうか。
Opinion Spam Detection:Detecting Fake Reviews and Reviewers をご覧になることをお勧めします
これは、スパム査読者の考え方を理解するのに役立つと思います。一般的に、私は各レビューのスコアを計算しようとします。
同じスパムレビューアによって作成された偽のレビューは、いくつかのパターンを共有します。例えばレビューが提出された時刻、入力速度(彼がレビューを入力するのに要した時間)、レビュー担当者の位置情報、言語スタイル、タイプミスなど。
正直なレビューを提示しようとする功績-ユーザーが投稿したレビューを含むほとんどのビジネスモデルがそのようなアプローチを好まない傾向にあるときは、やや珍しい見方。
あなたが現在行っていることについて....
ここではプロセスの一部のみを説明しました。多くのオンラインサイトの共通の特徴の1つは、ユーザーが何でもできるようにする前に、事前に信頼を確立することを主張することです。これは特に厄介だと思います。私の製品の経験を共有する許可が許可される前に、住所、年齢、靴のサイズを提供したくありません。 。確かに、私が本当に重大なレビューを投稿したい場合にのみ、私はそのようなフープを飛び越えそうです。したがって、ユーザーが直接関与するプロセスの部分は、レビューが記録された後(ただし、表示される前)に実行することをお勧めします。確認リンクを含む電子メールを送信することは、簡単で最小限の邪魔な方法です。
ブラウザーのフィンガープリントを使用すると、レビューの送信と検証の両方で、同じブラウザーがレビューを送信して確認したが、人々が複数のデバイスを使用できる場合に良い目安になります。
ユーザーIP +ユーザーブラウザーの指紋の組み合わせは既に存在します
クライアントのIPアドレスが静的であることはほとんどありません。サブネットを使用しても、それほど効果的ではありません。 ASN(またはそれに関連するORGレコード)を使用すると、粒度は低くなりますが、一貫性が高く正確な結果が得られます。 ASN番号を使用すると、クライアントアドレスの場所を特定するプロセスも簡略化されます。レビューを製品が利用可能な国に限定したい場合があります。ブラックオプスマーケティングを実施する組織があります(私の経験では、フィリピンと東ヨーロッパでは異常な密度があります)。
指紋の衝突に関するアドバイスはありますか?
それらを避けようとしますか?
何らかの理由で、これらのサービスを提供している企業は、ソリューションの一意性に関する統計の公開についていくらか控えめです-方法論を比較する文献は(元のpanopticlickの研究以外に)非常に少ないようです。
こちらのブログ投稿 に役立つポインタがあります。以前、これらの方法のいくつかを使用して、1160の異なるデバイスからの1056の一意のハッシュを報告しました。それ以来、独自性を大幅に向上させるキャンバスフィンガープリントを含めるように方法を更新しました。
遅かれ早かれ、レビューごとに多数のデータ-複数のIPアドレス、Cookie、指紋(および語彙、書き方など)があることに気づくでしょう。 spamassassinが機能する方法と同様の方法で、検出されたさまざまなフラグに重みを関連付ける方が適切である場合があります。