web-dev-qa-db-ja.com

Googleは404ステータスコードを認識しません

2種類のresponse headers(Chrome DevToolsの[ネットワーク]タブから完全な長さでコピーペーストされた)の404ページがあります:

  1. 応答ヘッダー:

    cache-control:max-age=0, no-store content-type:text/html date:Wed, 24 Jan 2018 10:55:59 GMT server:Apache/2.4.29 (Ubuntu) status:404 x-powered-by:PHP/5.5.9-1ubuntu4.22

  2. 応答ヘッダー

    cache-control:max-age=0, no-store cache-control:no-cache, max-age=0, must-revalidate content-type:text/html; charset="utf-8" date:Wed, 24 Jan 2018 10:55:40 GMT expires:Thu, 19 Nov 1981 08:52:00 GMT pragma:no-cache server:Apache/2.4.29 (Ubuntu) set-cookie:bypassStaticCache=deleted; expires=Thu, 01-Jan-1970 00:00:01 GMT; Max-Age=0; path=/; httponly set-cookie:bypassStaticCache=deleted; expires=Thu, 01-Jan-1970 00:00:01 GMT; Max-Age=0; path=/; httponly status:404 x-powered-by:PHP/5.5.9-1ubuntu4.22

最初の種類のresponse headersを含むページは、Googleによって404として認識されません。404の代わりに、それらのページが正規タグなしの重複ページとしてSearch Consoleに警告されます。

2番目の種類のresponse headersを持つページは、404として正しく認識されます。

認識されないは、Googleがそのようなページを呼び出すことを意味します正規のタグなしでページを複製する FirefoxとChromeの開発者ツールが正しい404ステータスコードを取得する。

認識済み意味:そのようなページは呼ばれます見つかりません(404)、次のスクリーンショットのように: enter image description here

なぜそうなのですか?正しいステータスコードの認識を妨げるもの答えには追加情報が必要ですか?ただ言う-私はそれを提供しようとします。

PS:新しいSearch Consoleのバグかもしれません...? @ JohnM

3
Evgeniy

HTTP応答ステータスは、応答の最初の行( " Status Line ")-質問の出力に現在表示されていません)によって示されます。 404応答の場合、次のようなものが表示されます。

HTTP/1.1 404 Not Found
status:404

Status応答ヘッダーは非標準です。

1
DocRoot