web-dev-qa-db-ja.com

ある特定の町からの直行トラフィックが急増

先月、私たちのサイトへの直接アクセスが150%近く増加している一方で、直帰率もかなり上昇していることに気付きました。

さらにドリルダウンした後、スタンフォードと呼ばれるコネチカット州のある町からの直帰率が2000%近く、直帰率が100%であることがわかります。

私は答えを探し回っていましたが、稼働時間監視ツールに関係しているのかもしれません。 Pingdom。

誰もがこの種の問題を知っている/経験している、どんな助けでも大歓迎

  • イングランドの町とスコットランドの町で同じトラフィックを受信して​​いることに気付いたところです。
9
Double Clicked

人間の訪問者からではないように見える奇妙な局所的なトラフィックスパイクの原因を特定するには、忍耐と探偵の仕事が必要ですが、基本的な手順は次のとおりです。

  1. 利用可能なツールを使用して、どこから来たのかを調べます(以下を参照)。

  2. リクエストの送信元、頻度、リクエストヘッダー自体、およびネットワークとサーバーへの影響を分析して、危険かどうかを判断します。

  3. 統計に表示されるのを防ぐためにGoogle Analyticsのみでブロックするか(Google Analyticsフィルターを使用)、サーバーでブロックして将来サイトに到達しないようにするか(ファイアウォールまたはサービスを使用するなど) Cloudflare )、またはそれを完全に無視する。

分析データに与える影響をより懸念していると思われるため、ここではセキュリティへの影響について詳しく説明しません。以下に、この特定のケースに関するいくつかの所見と、考えられるソースを判別し、Googleアナリティクスで不要なトラフィックを除外するためのポインターを示します。

おそらくPingdomではない

Googleアナリティクスの急増は、次の2つの理由からPingdomからの訪問とは考えられません。

  • PingdomのHTTPチェックはJavaScriptを解析しないため、組み込みのGoogleアナリティクススクリプトをトリガーしません。 (私は昨日Pingdomのサポートチームでこれを再確認しました。私もPingdomを使用しており、好奇心が強いからです。サポートメールからの直接の引用です:"HTTPチェックはJavaScriptコードを実行しないため、Googleアナリティクスは勝ちました'当社のプローブサーバーがお客様のウェブサイトに行った訪問の記録はありません。 "

  • Pingdomには現在エジンバラにサーバーがありません。コントロールパネルのページにIPアドレスと場所を持つすべてのプローブサーバーをリストします(ログインしているときに、すべてのPingdom管理ページの右下にある「Probe servers」という名前のリンク)。現在英国でリストされているのは、マンチェスターとロンドンのみです。

しかし、あなたは私の言葉をそれにとらえる必要はありません。スパイクが継続しており、Pingdomが突然の訪問と直帰率のスパイクの原因ではないことを確認したい場合、次のことができます。

  1. サイトへのPingdomリクエストを一時停止し、それらのエリアからのヒットが消えるかどうかを確認します。 (違いはないと思います。)

    - または -

  2. example.com/pingdom/any-url-you-likeにページを設定し、ホームページではなくそのページにPingdomリクエストをポイントし、(a)そのページのAnalyticsトラッキングコードを削除して、Googleアナリティクスの結果から/pingdom/サブディレクトリを除外します。または(b)ページごとにトラッキングコードを削除できない場合(たとえば、すべてのページにコードを含むCMSを使用していて、この振る舞いを変更するのに十分なアクセス権があります)。

Googleアナリティクスでリクエストをフィルタリングする方法

これは、Pingdom does JavaScriptを解析する疑いがある場合にのみ必要であり、実行することを示す兆候はありませんが、このようにPingdomからの訪問を除外することは、自分を安心させるかどうかを確認する1つの方法です。これを行う方法を学ぶことも役立ちます。必要に応じて、将来的に他の種類の訪問を除外できます。

  1. Googleアナリティクスにログインして、[管理者]リンクをクリックします(右上、[ヘルプ]の横)

  2. フィルタリングするプロファイルのドメイン名またはサイト名をクリックします。 (例:example.com

  3. 「フィルター」タブをクリックします。

  4. 「+新しいフィルター」をクリックします。

  5. フィルターに名前を付けて、「事前定義フィルター」を選択したままにします。

  6. ドロップダウンボックスから[除外...等しいサブディレクトリへのトラフィック...]を選択します。

  7. [サブディレクトリ]フィールドに/pingdom/と入力し、[大文字と小文字を区別する]を[いいえ]のままにします。

これが完了したら結果になるはずです:

Filtering Pingdom in Google Analytics

これらの設定を保存し、Pingdomチェックをexample.com/pingdom/any-page-or-url-that-existsに再ポイントすると、GoogleアナリティクスはそのURLへの訪問をフィルタリングします。 (Pingdomがホームページを指していなくても、この方法で基本的なサーバー稼働時間レポートを取得できます。)

Pingdomでない場合、それらのヒットはどこから来たのですか?

いくつかの方法で調べることができます:

1。最も跳ね返ったトラフィックを送信しているネットワークを確認します。Googleアナリティクスでこれを行うには、サイトの[標準レポート]セクションを確認し、左側から[オーディエンス]> [テクノロジー]> [ネットワーク]を選択します側。最後に、円グラフモードを選択した状態(デフォルト)で、右側のドロップダウンから[合計への貢献...バウンス]を選択します。

Total bounces

ユーザーが直帰率に貢献しているISPまたはネットワークプロバイダーのリストが表示されます。これは、特定のISPであり、1つのエリアまたはビジネスにトレースできる場合があります。跳ね返るトラフィックを送信するネットワークプロバイダーの名前を使用して、上記のようにGoogleアナリティクスから特定のネットワークをフィルタリングすることを選択できますが、サブドメインではなくネットワークでフィルタリングします。

また、リストにあるトップISPは、数百万人の顧客を抱える大規模な国内プロバイダーであり、あなたは賢明ではないでしょう。その時点で、Googleアナリティクスはドリルダウンして、そのプロバイダーの顧客のどれが繰り返しバウンスされたトラフィックを送信しているかを判断することはできません(アナリティクスにIPアドレス情報やその他の識別データが含まれなくなったため)。この種のデータを取得するには、IPアドレスを記録する別の統計プロバイダー( Clicky など)を使用するか、サーバーログを分析してIPアドレスごとにアクセスを記録できます。

2。 Webサーバーのアクセスログを調べて、既知のクローラーからの訪問を調べ、同じIPアドレスからの繰り返しアクセスを探します。AWStatsなどのWebベースの統計ツールがこれに役立ちます。特定のWebホストの間で非常に人気があり、既にインストールされている場合があります。

AWStatsからのサンプル出力 です。関連する2つのセクションは、「ホスト」と「ロボット/スパイダーの訪問者」です。

ホストセクションでは、バウンスを引き起こすためにサイトにアクセスしていたIPアドレスに関する手がかりが得られる場合があります(その後、GoogleアナリティクスでこれらのIPアドレスを除外できます)。 robots/spiderセクションは、JavaScriptを使用している可能性のあるサイトにアクセスしているクローラーまたは自動スクリプトについてのヒントを提供する場合があります。サーバーログの読み取りまたはアクセス方法がわからない場合は、ホスティングプロバイダーに問い合わせてください。

IPアドレスを取得しましたか?誰がそれを使用しているかを調べます。

AWStatsまたは他の場所のHostsセクションからIPアドレスを取得できた場合、 reverse IP lookup を実行して、誰がそれを使用しているのかを判断できます。

リバースIPルックアップは、リクエストが悪意があると思われる場合に悪用を報告できるホスティングプロバイダーの名前を提供します。または、お客様のWebサイトを悪用しようとして、スクリプト化された自動化を使用している国内ISPの名前が表示される場合があります。通常、不正行為レポートは[email protected]に送信できます。example.comはホスティングプロバイダーまたはISPの名前です。また、詳細について問い合わせることができる特定の会社の名前が表示される場合もあります。

10
Nick

これはおそらく、サイトコンフィデンス(別名NCCグループ)です。

私たちのサイトでは、GAフィルターで少し調べたところ、エジンバラとスタンフォードのミステリーヒットはすべて、Windows 7、IE8を搭載したPCからのものでしたが、800x600の解像度でやや怪しいものでした。

ログでIE 8のヒットをチェックし、5分ごとにヒットのパターンをすばやく見つけました。それらのIPのDNSをリバースします。それらはSite Confidenceからのものです。

1
Mikey C

WebサイトPingdomへのボットトラフィックを識別および除外する方法に関する優れた記事があります。ここには記事 が含まれています。http://www.blastam.com/blog/index.php/2012/06/ block-web-monitoring-bots-in-google-analytics / ここにコピーするには長すぎます

Keynoteなどのサービスを使用してWebサイトのパフォーマンスを監視している場合、Webメトリックに影響していることをご存知ですか? Keynote、Gomez、AlertSite、Pingdomなどのサービスは、実際のWebブラウザーを使用して、ロード時間のパフォーマンスを測定するために1日を通して繰り返しサイトにアクセスします。 GoogleアナリティクストラッキングJavaScriptを実行する実際のブラウザを使用して、世界中の複数の場所からサイトを読み込んでいます。

1
Anagio

Pingdomであるかどうかは、Pingdomサービスに設定した設定によって異なります。

Http要求を行うように設定されている場合は、はい、おそらくPingdomです。 httpリクエスト(pingまたは他のサービスのみ)を使用していない場合、Pingdomにはなりませんが、httpリクエストを使用していると想定します。

私はpingdomを使用しないので、テストの頻度を制御できるかどうかわかりません。できたら素晴らしい。そうでない場合は、単にpingテストを使用するように切り替えることができますが、それはWebサイトが稼働していることを保証するものではなく、サーバーが稼働していることだけを保証します。

Pingdomのテストの頻度を減らすことができず、pingdomが生成しているトラフィックの量に問題がある場合は、それを捨てる必要があります。ただし、1か月に2000件のリクエストはおそらく大きな問題にはなりません。ウェブサイトの分析情報を単に混乱させるだけです。

Pingdomリクエストを分離し、パターンを探すことで、これを回避することができます。次に、カスタム分析スクリプトがある場合、パターンを検出し、分析結果からパターンに付着しているIPアドレスを削除できます。ただし、これは面倒な価値はないと判断し、毎月Pingdomによって生成されるfalse hits biengの量を念頭に置いてください。

これがお役に立てば幸いです。

1
Marvin