Googleが自分のサイトからより少ないページのインデックスを作成する理由を調べるにはどうすればよいですか?
Googleのヘルプには次のように書かれていますが、あまり役に立ちません。
クロールおよびインデックス登録されたページの数が着実に増加していることは、Googleが定期的にコンテンツにアクセスでき、サイトがインデックス登録されていることを示しています。
インデックス登録されたページの数が突然減少した場合、サーバーがダウンしているか過負荷であるか、Googleがコンテンツへのアクセスに問題を抱えている可能性があります。
Googleがアクセスできるサイトの割合を確認するには、クロールされたページの数とrobots.txtによってブロックされたページの数を比較します。いくつかのグラフに表示される急激なスパイクまたはディップは、サイトの構成、リダイレクト、またはセキュリティの問題を示している可能性があります。
6月3日以降、Googleは次のようにも述べています:Googlebotはサイトにアクセスできません
過去24時間にわたって、GooglebotはサイトのDNS情報を取得しようとしたときに179エラーを検出しました。サイトのDNSクエリの全体的なエラー率は5.0%です。
2013年1月、サイトをDrupal 6からDrupal 7に更新し、いくつかのリンクが変更されました。 Googleの指示に従って問題を解決しようとしました。
問題を解決したと思われたら、Fetch as Googleを使用して、Googlebotがサイトに適切にアクセスできることを確認します。
「fetch as Google」でサイトのすべてのページをチェックアウトする必要がありますか?リンクを使用しなくなったためにリンクが壊れた場合はどうすればよいですか?
Xenu's Link Sleuth などのプログラムを使用して、自分のサイトをスパイダーします。これは、知らない問題を見つけるのに役立つ場合があります。
見つかった壊れたリンクは、削除するか、.htaccess(またはDrupalに機能があるかもしれませんが、Drupalに詳しくないかもしれません)を使用して、存在するページにリダイレクトできます。
Googleサイトマップを設定し、Googleウェブマスターツールに登録していることを確認してください。このDrupalプラグインは、開始に役立つはずです。 https://drupal.org/project/xmlsitemap
サイトマップは、サイトで利用可能なすべてのページについてGoogleに通知するため、ページをクロールすることがわかります。
Googleは、同じドメインの本質的に類似したページをインデックスに登録しません。これらのURLに一意の値がない場合、この減少を確認するのは自然です。
Drupal 6とDrupal 7の間のURL構造の変更を確認し、それらのURLが価値のあるものを提供しているか、ロボットディレクティブで参照されているかどうかを確認します。