複数のsitemap.xmlファイルをテストする方法はありますか?検証は正常に機能し、Googleはすべてのサブファイルを受け入れますが、Yandexの「サーバー応答チェック」は「ドキュメントにテキストが含まれていません」を返します。
クロールレートと全体的なインデックス作成の進捗状況から、両方の検索エンジンがサイトマップファイルからコンテンツを読み取れないという印象を受けます。 「Discovered –現在インデックスが作成されていない」=すべてのコンテンツの2/3が大量にあるため、両方ともクロールされたことはなく、Yandexでのインデックス作成の比率が低いためです。
このWebサイトには、サイトマップファイルに約750.000のリンクが含まれています。ファイルごとに50.000リンク(約11MB)を生成すると、クロールグラフが高くなり、その後ドロップします。ファイルあたりのリンク数が10.000の場合、グラフははるかに速く低下し、それ以降はほぼ同じレベルにとどまります。
さまざまなチェックを行いましたが、技術的にはすべて問題ないようですが、パフォーマンスを見るとかなり疑問です。 Robots.txtはフルアクセスを提供します。 robotsメタタグも。
以下のスクリーンショットをご覧ください。サイトマップファイルの場所: https://www.rusinfo.eu/sitemap.xml Yandexサーバーチェックリンク: https://webmaster.yandex.ru/tools/server-response/
Yandexの「サーバー応答チェック」が「ドキュメントにテキストが含まれていません」を返しています。
サイトマップファイルのシステム全体が実際に機能する場合-実際に検索エンジンによって適切に読み取られることを意味しますか?
確かに、エラーのないログファイルとアラートのないGSC/Yandex Webmasterは、サイトマップで問題のないものがすべてあることを意味します。
この問題は関連していますか
どのような問題ですか?もしかして
このWebサイトには、サイトマップファイルに約750.000のリンクが含まれています。インデックスは約150.000
これは、あなたのウェブサイトに固有のコンテンツが少なすぎるためです。ほとんどのコンテンツは複製されています-最初に他のメディアによって公開されています。 Googleにとって、サイトのほとんどの部分は、単なる二次的なニュースアグリゲーターです。
発生するのはサイトマップの問題ではなく、大量の重複コンテンツの問題です。