先月、Googleのウェブマスターツールに奇妙な動作があることに気付きました。
通常処理され、Googleからの問題なしに有効なサイトマップを提供しますが、送信されたWebページの数は増加し続けます(30.923ページ)が、インデックスページは増加しません(1月末から26.819ページ) )。
クローラーの統計を確認すると、すべてが正常に見え、クロールエラーはありません。
この数か月間、ウェブページに大きな変更はありませんでした。
誰かが同様の問題と考えられる提案に気づきましたか?
Googleの世界へようこそ。サイトマップを送信すると、インデックスに登録されたページの数がGoogleウェブマスターツールで送信された数と一致しないようです。それは何年もの間この方法でした。理由は定かではありませんが、これだけ言えます。 Googleは、ページがサイトマップから取得される速度を管理するアルゴリズムを適用しているようです。サイトマップ内のページが多いほど、速くなります。終わりに近づくにつれて、速度はますます低下します。少なくともサイトマップ全体がインデックスに登録されていないように見えるので、ページの総数がほぼ完全に不足していると思われます。そして、そうかもしれません。毎日、サイトマップからフェッチされるページ数が非常に少ないため、最後の数ページ(多くの場合数千単位で測定される)に時間がかかります。私のサイトでは、これは2000〜4000の範囲であり、まさにあなたが経験していることのようです。
方法に関する別の考慮事項は、サイトマップが読み取られ、すべてのエントリが取得されるキューに入れられることです。 Googleがサイトマップからのページの取得を遅くすると、重要とみなされる、他の手段で発見された、検索で良好に機能するなどのページがキューの先頭に移動され、ミックスの一部になります。したがって、Googleが1日に約1000〜2000ページをフェッチするように速度を落とすと、毎日がキュー内の他のアイテムのために進むにつれて、サイトマップから残りのページが少なくなります。
サイトマップを使用してコンテンツを送信しても、guaranteeはインデックスに登録されませんが、特にクロールを取得するのに役立ちます。
送信されたものとインデックスに登録されたものとの不一致の一般的な理由は重複です。ページの複数のバージョンが送信されているか、ページが一意ですが、Googleはそれらをインデックス付けを保証するのに不十分であると判断します。
あなたが試すかもしれません:
nofollow
リンクなどの理由を探します(たとえば、robots.txt
がアクセスをブロックしている場合、Googleウェブマスターツールは警告通知を受け取ります) 。Google側の問題だと思います。
GWTサイトマップの統計をサイトで監視しているスプレッドシートを保持しているところ、まったく同じ動作を確認しています。 1月20日にインデックス付けされたページ数は、1年10日をチェックしたときの数とは異なりました。ほとんどの場合、過去3年半にわたってチェックした数日ごとでしたが、1月20日以来、送信されたページの数が増加し、別のサイトマップを追加しました。
あなたと同じように、他のすべてのインジケータは正常に見え、サイトはかなり動的で大規模なインデックス付きサイト(10万ページ超)であり、過去3か月まで、これまでに同じ数のインデックス付きページがなかった一週間。
私はそれがバグであるかどうか疑問に思っていましたが、インターネット上でそれについて話している人を見つけることができませんでした。さらに調べたことがありません。私はそれがすべての人に影響を与えることはないと思うか、今までに他の場所で聞いたことがあると思います(ただし、インデックス番号haveが1月中旬以降に変更された場合、誰でもこれを確認できます)が、 veは私だけではないという証拠を提供しました。