web-dev-qa-db-ja.com

接続が殺到したApacheログ-「(ggpht.com GoogleImageProxy経由)」

私のサーバーは100%CPUで実行されていて、Apacheログを見ると、次のような数十万の接続が見つかりました。

10.190.45.31 - - [13/Mar/2014:15:29:02 +0000] "GET SOMETHING HTTP/1.1" 200 2261 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7 (via ggpht.com GoogleImageProxy)"

IPは私のロードバランサーのIPですが、残念ながらログを設定していなかったため、この要求の真のソースを特定できません。

これがどんな種類のトラフィックか知っている人はいますか?

7
user967722

私もこのような交通を見ています。

  • IPアドレスは常に66.249.64.0/19の範囲にあり、Googleが所有しています。
  • 私が目にするUser-Agentは、あなたがそこに持っているものと常に同じです。
  • リクエストされているURLはほとんどが画像ですが、そうでない場合もあります。
  • ほとんどの画像URLは複数回リクエストされます。リクエスト数の多い上位2つの画像(ちなみに、プラットフォームから送信されるメールにのみ含まれます)は、リクエスト総数の2/3でした。

私はそれが メールに画像を自動的に読み込むようにGmailに加えた最近の変更 に関連していると確信していますが、プロキシを介して行うため、受信者を識別できません。

このブログ投稿は私をバックアップし、同じUser-Agentを含みます。

これをテストするには、次のようなタグを含むHTMLアドレスを自分のGmailアドレスに送信します(もちろん、ドメインをexample.comに置き換えます)。

<img src="http://example.com/this_probably_doesnt_exist.jpg">

このUser-AgentからそのURLに対する同じ種類のヒットが見つかった場合、私は推測しています。

13
Ladadadada