web-dev-qa-db-ja.com

インデックス登録されたウェブページは上昇を停止しましたが、送信済みは正常に上昇し続けます

先月、Googleのウェブマスターツールに奇妙な動作があることに気付きました。

通常処理され、Googleからの問題なしに有効なサイトマップを提供しますが、送信されたWebページの数は増加し続けます(30.923ページ)が、インデックスページは増加しません(1月末から26.819ページ) )。

クローラーの統計を確認すると、すべてが正常に見え、クロールエラーはありません。

この数か月間、ウェブページに大きな変更はありませんでした。

誰かが同様の問題と考えられる提案に気づきましたか?

3
GeGe

Googleの世界へようこそ。サイトマップを送信すると、インデックスに登録されたページの数がGoogleウェブマスターツールで送信された数と一致しないようです。それは何年もの間この方法でした。理由は定かではありませんが、これだけ言えます。 Googleは、ページがサイトマップから取得される速度を管理するアルゴリズムを適用しているようです。サイトマップ内のページが多いほど、速くなります。終わりに近づくにつれて、速度はますます低下します。少なくともサイトマップ全体がインデックスに登録されていないように見えるので、ページの総数がほぼ完全に不足していると思われます。そして、そうかもしれません。毎日、サイトマップからフェッチされるページ数が非常に少ないため、最後の数ページ(多くの場合数千単位で測定される)に時間がかかります。私のサイトでは、これは2000〜4000の範囲であり、まさにあなたが経験していることのようです。

方法に関する別の考慮事項は、サイトマップが読み取られ、すべてのエントリが取得されるキューに入れられることです。 Googleがサイトマップからのページの取得を遅くすると、重要とみなされる、他の手段で発見された、検索で良好に機能するなどのページがキューの先頭に移動され、ミックスの一部になります。したがって、Googleが1日に約1000〜2000ページをフェッチするように速度を落とすと、毎日がキュー内の他のアイテムのために進むにつれて、サイトマップから残りのページが少なくなります。

1
closetnoc

サイトマップを使用してコンテンツを送信しても、guaranteeはインデックスに登録されませんが、特にクロールを取得するのに役立ちます。

送信されたものとインデックスに登録されたものとの不一致の一般的な理由は重複です。ページの複数のバージョンが送信されているか、ページが一意ですが、Googleはそれらをインデックス付けを保証するのに不十分であると判断します。

あなたが試すかもしれません:

  1. XMLサイトマップによって送信されたすべてのURLがユニークであることを確認する(たとえば、ページコンテンツに影響しないパラメーターのために同じURLを複数回使用しない)、およびvalid(リダイレクト、404などではない)
  2. ページのコンテンツが一意であることを確認します。多数のページで使用される大量の「定型」コピー、または異なるカテゴリの同じコンテンツの繰り返しなどを探します。
  3. たとえばWordPressのアーカイブページやタグページなど、サイトの分類が複製を作成するかどうかを確認します。
  4. サイトでクローラーソフトウェアを実行して、コンテンツに実際にアクセスできることを確認します。予想よりも少ないコンテンツが見つかった場合、JavaScriptベースのナビゲーション、nofollowリンクなどの理由を探します(たとえば、robots.txtがアクセスをブロックしている場合、Googleウェブマスターツールは警告通知を受け取ります) 。
1
GDav

Google側の問題だと思います。

GWTサイトマップの統計をサイトで監視しているスプレッドシートを保持しているところ、まったく同じ動作を確認しています。 1月20日にインデックス付けされたページ数は、1年10日をチェックしたときの数とは異なりました。ほとんどの場合、過去3年半にわたってチェックした数日ごとでしたが、1月20日以来、送信されたページの数が増加し、別のサイトマップを追加しました。

あなたと同じように、他のすべてのインジケータは正常に見え、サイトはかなり動的で大規模なインデックス付きサイト(10万ページ超)であり、過去3か月まで、これまでに同じ数のインデックス付きページがなかった一週間。

私はそれがバグであるかどうか疑問に思っていましたが、インターネット上でそれについて話している人を見つけることができませんでした。さらに調べたことがありません。私はそれがすべての人に影響を与えることはないと思うか、今までに他の場所で聞いたことがあると思います(ただし、インデックス番号haveが1月中旬以降に変更された場合、誰でもこれを確認できます)が、 veは私だけではないという証拠を提供しました。

1
joshuahedlund