ウェブサイトから数千ページを削除しました。私のsitemap.xmlには表示されず、ウェブ上の他のページがこれらを指していません。
Googleウェブマスターツール(GWT)のクロールエラーページは、それらが見つからないと報告し始めます。それらを修正済みとしてマークするオプションがあります。修正済みとしてマークする必要がありますか?それらは実際には修正されておらず、修正されることはありません。
RLを削除ページもありますが、それらのページを1つずつ手動で削除する方法はありません(REM:これらのページは単一のディレクトリになく、あちこちにありました。 robots.txt私が使用できるディレクティブではありません)。
Googleがページを見つけられない場合、インデックスから自動的に削除しますか、または修正済みとしてマークする場合、何度も何度もページにアクセスしようとしますか?
修正済みとしてマークするかどうかは、サイトのパフォーマンスには影響しません。この機能のアイデアは、ウェブマスターがエラーを修正したときにレポートをクリーンアップできるようにすることです。 Googleは最終的にページが戻ってこないという考えを得るでしょうが、しばらく時間がかかります。
おそらく、これらのページが永久になくなった場合、410 HTTPコードを返すはずです。どうやらGoogleが410と404を扱う方法に大きな違いはないようですが、 GoogleのJohn Muellerが示唆している 410がより早くクリーンアップされるかもしれません。
または、削除した内容と理由に応じて、ほぼ同等のいくつか(たとえば、親カテゴリのランディングページ)に301リダイレクトするというユーザーエクスペリエンスの良い議論があるかもしれません。これにはSEOの利点もあります。
Googleはインデックス全体を定期的に更新します。ウェブをクロールすると、新しいページが自動的に検出され、古いリンクが削除され、既存のページの更新が反映され、Googleインデックスが最新かつ可能な限り最新の状態に保たれます。
サイトの古いページが検索結果に表示される場合は、ページがヘッダーで404(見つかりません)または410(なくなった)のステータスを返すことを確認してください。これらのステータスコードは、リクエストされたURLが無効であることをGooglebotに伝えます。一部のサーバーは、存在しないページに対して200(成功)のステータスを返すように誤って設定されています。これは、要求されたURLが有効であり、インデックスを作成する必要があることをGooglebotに通知します。ページがhttpヘッダー経由で真の404エラーを返した場合、誰でもウェブページ削除リクエストツールを使用してGoogleインデックスから削除できます。真の404エラーを返さない古いページは、通常、他のページがそれらへのリンクを停止すると、自然にインデックスから外れます。