私は約700人の登録ユーザーでサイトを運営しています。通常、30〜50回のヒットがあります。
過去3日間で、トラフィックはめちゃくちゃ速く増加しました(Google Analyticsによると)。 今日は7,287ヒットしました。新規登録ユーザー数は比例して増加していません。
彼らの大多数はロシア出身のようですが、私はアメリカにいて、私のサイトは英語だけなので面白いです。
今、私はグーグルアナリティクスでこれらすべての紹介リンクがどうなっているのかをチェックするためにグーグルをしました。
それらのほとんどはロシアの紹介スパムヒットであり、誰かが私のHTMLからGoogle Analyticsキーをこすり取った後、サーバーに実際に何も要求せずにGoogle Analyticsを何千回もヒットして、私を苛立たせていることを読みました。は問題ありませんが、データが汚染されているため、Google Analyticsの価値はほとんどなくなったと思いますが、それだけではありません...)。
ただし、私のNginxログには、過去数日間のトラフィック量の大幅な増加が示されています。ロシアの紹介スパムヒットは、GoogleAnalyticsの総数の約半分しか占めていません。正直なところ、誰かが私のサイトに何度も何度もアクセスする理由を理解することはできません。私のサイトから意味のあるコンテンツを取得するには、人間の介入が必要です。
この不正なトラフィックから身を守るために何ができますか? IPアドレスのブラックリストへの登録を開始する唯一のオプションはありますか?
あなたはちょうどかなり人気になったようです。誰かがあなたの記事のいくつかへのリンクを配置したに違いありません。
「Referer」ヘッダーのなりすましは非常に簡単で、スクレーパーやボットがそれを行うのを何度も見ました。 TCPトラフィックをスニッフィングして、これらのHTTPリクエストがどのように見えるかを示していただければ幸いです。Tcpdumpでうまくいく可能性があります。環境によって異なりますが、試してみてください。
$ tcpdump -i eth0 -A -vvv -s 500 'tcp port 80 and ip[2:2] > 40 and tcp[tcpflags] & tcp-Push != 0 and dst port 80'
これにより、Webサーバーに送信されたすべてのHTTPリクエストがスニッフィングされ、結果をgrepしてそれらのロシアのリファラーを探すことができます。