Google Search Consoleで継続的にポップアップする404で頭を悩ませてきました。これらは非常に古いリンク(4年以上)であり、もはや存在しないため、現在のライブサイトにリンクが誤ってリンクされないようにしています。ただし、それらは引き続きGoogle検索コンソールに表示されます。
GoogleのURL削除ツールを使用してこれらのページをインデックスに登録しないことをGoogleに通知しようとしましたが、GSCでは依然として404として表示されます。 https://support.google.com/webmasters/answer/1663419?hl=en
一部のリンクについては、サイトからリンクされた「リンク元」タブがあり、おそらく404として報告された.phpページにリンクしていますが、それらのページをチェックし、そこには.phpリンクはありません。
404ステータスコードは、ページが見つからないことを意味します。 Googleはこれを一時的なステータスと解釈し、ページにアクセスできるかどうかを確認するために戻ってきます(GSCでこれらのページが表示されているのはそのためです)。
ただし、410ステータスコードは、ページがなくなっており、戻ってこないことを意味します。 Googleは410ステータスコードを検出すると、ウェブマスターが意図的にページをダウンさせ、クロールの試行を停止したと見なします。
可能であれば、それらのページのステータスコードを410に変更します。
これが、Google Search Consoleの仕組みです。存在しないページへのリンクを取得した場合、Googleはそのページを時々チェックし続けます。そして、それらがそもそも存在していなかったとしても、それらのページが存在しないことを警告し続けます。
クロールエラーのページは優先度順に並べられます。これは、(a)そのページを指すリンクの数、および(b)それらのリンクがサイト自体からのものかどうか(つまり、外部サイトからのリンクは1つのみより低い優先度)。
そのため、上部から開始して、各URLをクリックし、[リンク元]タブをクリックして、リンクがどこから来たとGoogleが考えるかを確認します。可能であれば、破損したリンクを修正します。ページにアクセスし始めたら、あきらめて先に進むことはできません。