web-dev-qa-db-ja.com

複数のSitemap.xmlファイルをテストする方法は?

複数のsitemap.xmlファイルをテストする方法はありますか?検証は正常に機能し、Googleはすべてのサブファイルを受け入れますが、Yandexの「サーバー応答チェック」は「ドキュメントにテキストが含まれていません」を返します。

クロールレートと全体的なインデックス作成の進捗状況から、両方の検索エンジンがサイトマップファイルからコンテンツを読み取れないという印象を受けます。 「Discovered –現在インデックスが作成されていない」=すべてのコンテンツの2/3が大量にあるため、両方ともクロールされたことはなく、Yandexでのインデックス作成の比率が低いためです。

このWebサイトには、サイトマップファイルに約750.000のリンクが含まれています。ファイルごとに50.000リンク(約11MB)を生成すると、クロールグラフが高くなり、その後ドロップします。ファイルあたりのリンク数が10.000の場合、グラフははるかに速く低下し、それ以降はほぼ同じレベルにとどまります。

さまざまなチェックを行いましたが、技術的にはすべて問題ないようですが、パフォーマンスを見るとかなり疑問です。 Robots.txtはフルアクセスを提供します。 robotsメタタグも。

  • ファイルが存在するときに「サーバー応答チェック」がエラーを返す理由を確認する方法を誰かが提案できますか?
  • サイトマップファイルのシステム全体が実際に機能するかどうかをテストする方法はありますか?つまり、実際には検索エンジンによって適切に読み取られていますか?
  • この問題は、.htaccessファイルで設定された設定に関連していますか?

以下のスクリーンショットをご覧ください。サイトマップファイルの場所: https://www.rusinfo.eu/sitemap.xml Yandexサーバーチェックリンク: https://webmaster.yandex.ru/tools/server-response/

前もって感謝します - enter image description hereenter image description hereenter image description hereenter image description hereenter image description hereenter image description here

1
igi

Yandexの「サーバー応答チェック」が「ドキュメントにテキストが含まれていません」を返しています。

enter image description here

enter image description here

サイトマップファイルのシステム全体が実際に機能する場合-実際に検索エンジンによって適切に読み取られることを意味しますか?

確かに、エラーのないログファイルとアラートのないGSC/Yandex Webmasterは、サイトマップで問題のないものがすべてあることを意味します。

この問題は関連していますか

どのような問題ですか?もしかして

このWebサイトには、サイトマップファイルに約750.000のリンクが含まれています。インデックスは約150.000

これは、あなたのウェブサイトに固有のコンテンツが少なすぎるためです。ほとんどのコンテンツは複製されています-最初に他のメディアによって公開されています。 Googleにとって、サイトのほとんどの部分は、単なる二次的なニュースアグリゲーターです。

発生するのはサイトマップの問題ではなく、大量の重複コンテンツの問題です。

1
Evgeniy