最近、私のサイトが過負荷になり、bingbotが犯人であることが判明しました。サイトのクロールレートをbingウェブマスターツールで最小値に設定しましたが、bingbotがすべてのクローラーの中で最も多くのアクセス(1日あたり約30000リクエスト)を持っています。 Googleは1日あたりのリクエストが少なくなっています。
また、bingbotから大量のトラフィックが発生しますか?クロールレートを最小に設定しても動作しないのはなぜですか?
本当にBingボットだと思いますか? Digを使用して逆IPルックアップを行うときに、予想外の場所からのものであることが判明した不許可を無視するボットを見てきました。
Dig -x 157.55.39.142
; <<>> Dig 9.9.5-3-Ubuntu <<>> -x 157.55.39.142
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 30244
;; flags: qr rd ra; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 1
;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 512
;; QUESTION SECTION:
;142.39.55.157.in-addr.arpa. IN PTR
;; ANSWER SECTION:
142.39.55.157.in-addr.arpa. 71 IN PTR msnbot-157-55-39-142.search.msn.com.
;; Query time: 57 msec
;; SERVER: 8.8.4.4#53(8.8.4.4)
;; WHEN: Thu Jun 12 18:18:06 EDT 2014
;; MSG SIZE rcvd: 104
逆ルックアップは、IPが実際にBingの検索ボットに関連していることを示しています。
彼らは、robots.txtファイルのクロール制御ディレクティブが、設定された設定よりも優先されると述べています。
http://www.bing.com/webmaster/help/crawl-control-55a30302
そうでない場合は、コントロールを使用してサイトのクロールを調整してみてください。