一部のページが完全に削除されたときに、410
の代わりに404
を返すのは理にかなっていますか? このビデオ で、Matt CuttsはGoogleがそれらを同じように扱うが、410
を実装する他の理由があると言います(技術的な正確さを除く)?
弊社のウェブサイトでは、永久に削除されたページに対して最近410エラーを実装しました。 Googleのインデックスには約4,000万ページあり、Googlebotによる1日あたり200万のリクエストでクロールされます。
データベースをクリーンアップした後、ウェブマスターツールのクロールエラーに多数の404エラーが表示され続けることがわかりました。 404ステータスではなく410ステータスに切り替えた場合、1日あたりのエラー数は半分になりましたが、実行されたリクエストの総数はほぼ同じままでした。つまり、最終的には1日あたりのクロールページの成功率が高くなります。 404ステータスのページは、インデックスから完全に削除される前に複数回クロールされるようです。
ですから、Googleクロールの予算を維持するために、適切な場所で410を使用することは間違いなく価値があります。
この世界にはグーグル以上のものがあります。 410は、ファイルがなくなったことをボットに明確に伝えます。 404はそうではありません。永続的なボットは404を無期限に見つけようとするかもしれませんが、410をすぐに見つけようとするとサーバーが非常に幸せになります。
Googleよりも多くの検索エンジンが存在することに加えて、Googleが410の応答を処理する方法を変更しないと想定する理由もありません。確かに、それはすでに起こっているようです:ビデオでMatt Cuttsが引用する情報は2007年のものですが、GoogleのWebmaster Centralフォーラムの 2009年のJohn Muによるこの投稿 はそうではありません:
「私はここでチームと404対410の事柄をフォローアップしました。他の一部の人がここや他の場所で述べたように、私たちは過去にも同じように扱ってきました。
ただし、ウェブマスターが実際にそれらをどのように使用するかを調べた後、410 HTTP結果コードを404より少し「永続的」として扱っています。したがって、ページがもはや存在せず、二度と存在しないことが確実な場合は、 410を使用するのは良いことです。」
したがって、Googleは実際に410の応答を404とは異なる方法で処理しているようです。
私の経験では、Googleは410エラーコードを理解していません。
少し前に、古いURLがすべて「410 Gone」になるようにサイト全体を変更しました。新しいURLとの直接的な関係がないため、301リダイレクトを使用できません。
古いURLがなくなったことをGoogleに伝えるために.htaccess
を使用しましたが、サイトに膨大な量の404エラーがあることを通知し続けます。クロールエラーレポートでURLを確認しましたが、それらはすべて、410であり、404ではありません。
この世界にはグーグル以上のものがあります。
真実のために引用。あなたの要件を考えて、ボット(そしておそらく人間も)にページが永久に削除されたであることを伝えるために、説明するページへの301
リダイレクトを選択します(必要な場合)コンテンツが削除された理由、またはボット/ユーザーをインデックスページに戻す。
あまり知られていないHTTPエラーコードは通常、サポート、理解、または実装されていないため、通常は期待されるシームレスなブラウジングエクスペリエンスを確保するためのものに固執します。
どちらのオプションを選択するかは、(現在の)欠落しているコンテンツに対するリクエストの数に依存します。