web-dev-qa-db-ja.com

スパムボットはどのように機能しますか?

フォーラムスパムボットによって大ヒットしているフォーラムがあります。もちろん、何かを打ち負かすための最善の方法は敵を知ることです。後でそれらのスパムボットを倒すことを心配しますが、今はそれらについてもっと知りたいです。読み返してみると、主題に関する詳細な情報がないことに驚きました(または、Google検索結果を改善するために正しい検索語を入力することができなかったのかもしれません)。

私は、スパムボットに関するすべてを学ぶことに興味があります。私は他のフォーラムで質問し、「Spambotsは常にあなたのサイトに登録しているユーザーです」のようなブラシオフの回答を得ました。

  • フォーラムスパムボットの仕組み
  • 「新規ユーザー登録」ページをどのように見つけますか? (特にwww.forum.com/register.htmlのように専用のURLを持たないフォーラムもありますが、代わりにクエリ文字列やURLバーには見えない他のメソッドを使用しているため、特に驚いています)
  • 各「新規ユーザー登録」フィールドに入力する内容をどのように知るのですか?
  • スパム/データの入力が可能なページとそうでないページをどのように判断しますか?
  • 彼らもこのページを「表示」しているのでしょうか?
  • ..そうでない場合、彼らはサーバーと直接通信していると仮定します-どのように-これは可能ですか?どうやってやっているの?
  • フォーラムスパムボットはCAPTCHAを破ることができますか?彼らは論理的な質問を解決できますか(どのように?)?数学の質問?
  • クライアント側のアンチボット検証スクリプトをリバースエンジニアリングしますか?サーバー側のスクリプト?
  • それらを防ぐためにまだ有効なテクニックは何ですか?
  • スパムボットはどこから来たのですか?ボットがサイトを次々と破壊するのを見ると、コンピューターの後ろに座っている人はいらいらしますか?それとも、どういうわけか単にインターネット上に「リリース」するだけで、彼らはsnしているのでしょうか?スパムボットは感染したコンピューターのどこかで「実行」されていますか?彼らは自分自身を複製しますか?
43
rlb.usa

「新規ユーザー登録」ページをどのように見つけますか? (一部のフォーラムには専用のURL(例:www.forum.com/register.htmlがない)がありますが、代わりにクエリ文字列やURLバーには表示されない他のメソッドを使用しているため、特に驚いています)

彼らは次の方法で新しいサイトを見つけます。

  • クロールし、既知のソフトウェアの署名を探します。通常、これは著作権やメタタグのようなテキストのスニペットですが、一貫した識別子である可能性があります。これは通常、ブログおよびフォーラムソフトウェアに適用されます。
  • 手動で含める。世界の多くの地域で人件費が安い人間は、簡単に悪用可能な既知のソフトウェアまたはフォームを探してデータベースに追加します。これは通常、カスタム登録および連絡フォームに適用されます。
  • 彼らはリストを買う。電子メールアドレスがスパマーによって販売されているように、既知の脆弱または優先ターゲットサイトリストも販売されています。

各「新規ユーザー登録」フィールドに入力する内容をどのように知るのですか?

彼らは、フィールド名をガイドとして使用して、各フィールドに入力する内容を知っています。 99.99%の確率で、電子メールアドレスフィールドの名前が「email」または「email」という単語を含むものになります。その分野がおそらく電子メールアドレス用であることを知るためにロケット科学者である必要はありません。名前、ログインID、アドレスなどのようなものについては、同じ原理で機能します。

スパム/データの入力が可能なページとそうでないページをどのように判断しますか?

彼らは気にしません。自動化されたツールは、非常に短時間で非常に多くのフォームを実質的に無料で試すことができるため、可能なすべてのフォームを試すのは簡単です。人間の労力が関与する場合、彼らは「スクリプトキディ」であり、明白なものを試して、フォームが脆弱である可能性があることを示す何らかの応答を受け取るかどうかを確認します。基本的に、フォームはユーザー入力を受け入れるページと同様に、それらの潜在的なターゲットです。

フォーラムスパムボットはどのように機能しますか?

彼らもこのページを「表示」しているのでしょうか? ..そうでない場合、彼らはサーバーと直接通信していると仮定します-どのように-これは可能ですか?どうやってやっているの?

スパムボットはどこから来たのですか?ボットがサイトを次々と破壊するのを見ると、コンピューターの後ろに座っている人はいらいらしますか?それとも、どういうわけか単にインターネット上に「リリース」するだけで、彼らはsnしているのでしょうか?スパムボットは感染したコンピューターのどこかで「実行」されていますか?彼らは自分自身を複製しますか?

すべて自動化されています。 xrumer などのツールが構築および販売されており、既知の脆弱性を持つソフトウェアを悪用する機能が含まれています。誰でもそれを購入でき、セットアップ後は多かれ少なかれ火と忘れがちです。リスト内のすべてのフォーラムにアクセスし、可能な限りスパムを送信しようとします。ブルートフォースが原因で成功し、スパマーにとって価値があります。だから彼らは決して止まらない。彼らはそれが機能するためにかろうじて指を持ち上げる必要があります。

フォーラムスパムボットはCAPTCHAを破ることができますか?彼らは論理的な質問を解決できますか(どのように?)?数学の質問?

はい、ただし常にではありません。実装の程度に依存します。しかし、大企業が提供するものを含む多くのキャプチャーはbeatられており、事実上役に立たない。そのため、それらを停止するには複数の形式の保護が必要です。その場合でも、人間は通常どんなシステムにも勝てる。

それらを防ぐためにまだ有効なテクニックは何ですか?

前の回答から :次のようないくつかのことを行うことができます(そして、1つ以上を行う必要があります)。

1)ボットのみに見える偽のフィールドを配置します。次に、そのフィールドがフォームの残りの部分とともに送信された場合、それを無視できます(必要に応じてそれらを禁止します)。 非表示のリンクをたどる悪いボットをトラップする もできます。

2) reCAPTCHA のようなCAPATCHAを使用する

3)ユーザーが5 + 3のような質問に答える必要があるフィールドを使用します。人間は誰でも答えることができますが、ボットはフィールド名に基づいてフィールドに自動入力するため、何をすべきかわかりません。そのため、そのフィールドは正しくないか欠落しているため、送信は拒否されます。

4)トークンを使用してセッションに追加し、フォームに追加します。トークンがフォームで送信されないか、一致しない場合、トークンは自動化され、無視できます。

5)同じIPアドレスからの繰り返し送信を探します。フォームがあまり多くのリクエストを受け取るべきではないが、突然ボットにヒットしている可能性がある場合、一時的にIPアドレスをブロックすることを検討する必要があります。

6) Akismet を使用します。スパムの識別に優れています。

48
John Conde

フォーラムスパムボットはどのように機能しますか?

才能のある(悪の場合)プログラマーがそれらを書く-おそらくそれらを書く人々と同じくらい多くの異なるタイプのスパムボットがありますが、残念なことに、それは少数のスパムボットの作者が管理者のために人生を台無しにするために彼らの仕事を共有し、売るだけで十分です...

人気のあるフォーラムスパムアプリケーションの1つは「xrumer」です。

私はこれがあなたの質問のすべてに答えているわけではないことを理解していますが、ボットがうまくできないこと(複雑な非静的ロジックの質問を解決するなど)は、海外の低賃金労働者によって行うことができることに言及する必要があると思います。スパムは他のビジネスと同様にビジネスであり、スパムメッセージを送信するために安価な労働力が不足することはありません。

11
danlefree

私は WordPressのアンチスパムプラグイン を作成しました。これはかなり良いスパムをブロックしますCaptchaなしまたはその他のもの。

仕組み:コメントフォームに2つの追加フィールドが追加されます。最初は、現在の年についての質問です。 2番目は空でなければなりません。ユーザーがサイトにアクセスすると、最初のフィールドはjavascriptで自動的に回答され、2番目のフィールドは空白のままになり、両方のフィールドはユーザーに対して非表示および非表示になります。スパマーがコメントフォームを送信しようとすると、最初のフィールドで回答を間違えたり、空のフィールドを送信しようとしてスパムコメントが拒否されます。ユーザーはCaptchaや他の何かを入力してボットではないことを証明する必要はありません。すべてがjavascriptによって行われます。

プラグインをダウンロードし、コードを使用してサイトのスパムの問題を解決できます。

2
webvitaly

彼らを倒そうとするとき、私が心に留めておくべきことの1つは、彼らの目的が黒人のためにできるだけ多くのウェブサイトへのリンクを投稿することである通常は -hat SEOの利点。

彼らはあなたのサイトではなく、アクセスするサイトの量を気にします。あなたのサイトだけをスパムしたい人は、ロボットを使わずに簡単にサインアップできます。

そのため、よく書かれたオーダーメイドテスト(フォーラムメンバーが答えを知っている質問など)は、ロボットが賢明である可能性のある事前に作成されたテストよりも、ロボットに対してほとんど常に効果的であると確信しています。に。

たとえば、ロボットがRecaptchaをクラックした場合、何百万ものフォームにアクセスしてスパムを送信できます。特注のテストに割り込んだ場合、1つのWebサイトにしかアクセスできないため、自動化されたスパムボットはそれを実行しません。

https://www.projecthoneypot.org は、使用する適切なデータを提供する場合があります(ブロックするキーワードやIPなど)

0
Richard B