存在したことのないページのクロールエラー404（見つかりません）を報告するGoogleウェブマスターツール

Question

Google Webmaster Toolsは、私が開発したWebサイトに存在したことのない.htmlページのクロールエラー「404（Not Found）」を報告しています。報告されているページは「tyuiabmog.html」であり、人間によって命名されたようには聞こえません！

Googleがこの存在しないページをどのように見つけたのか、なぜクロールしようとしているのかについて、誰かが私に光を当てるのを手伝ってもらえますか？

Jacob Hume · Accepted Answer

Googleや他の検索エンジンがこれを実行して、Webサイトのデフォルトの404動作を発見すると信じています。ランダムに名前が付けられたページにアクセスします具体的には存在しないためであるため、404ページを、インデックスを作成する通常のページと区別できます。これにより、たとえば404ステータスコードを返さないサーバーを正しくクロールできます。

Collector · Answer

WMTでページが報告された場合、ボットが実際にこのページを正常にスキャンしようとしたことを意味します。エラーをクリックすると、ページのリンク元を確認できます。 Web全体にWebサイトへの無効なリンクが存在する可能性があるため、調査し、必要に応じてこれらのWebサイトの所有者に通知する必要があります。

選択された答えは、ボットがどのように404を見つけようとするのかを示しているようですが、これは質問の内容ではないようです。

Sinan · Answer

一部のページ（サイトまたは外部）がドメイン上のそのファイルにリンクしている可能性があります。そのファイルが存在しないため、404エラーが発生します。

Cynthia Coffield · Answer

この種のエラーは、以前はエラーのある正規のタグにポップアップ表示されていました。

ウェブマスターツールで404エラーを見つけて、[リンク元]に移動します。 Linked From URLをプルアップし、そのページでソースを表示します。必ず404エラーリンクのソースを検索してください-隠されているかもしれませんが、そこにあるはずです。

また、Googleウェブマスターツールの404ページからリンクされた404ページに出会いました。どうすればいいのかわかりません。

cedverd · Answer

これらのエラーは、誰かがあなたのサイトに存在しないURLをブラウズするときに起こります-誰かがブラウザでURLをタイプミスしたか、誰かがリンクURLをタイプミスしたかもしれません。
これらの予期しないURLは、JavaScript、Flashファイル、またはその他の埋め込みコンテンツで見つかったリンクをたどろうとするGooglebotによって生成される可能性があります
あなたのサイトはこのようなコードを使用するかもしれません

<a href="helloworld.pdf" onClick="_gaq.Push(['_trackPageview','/download-helloworld']);">Hello World PDF</a>

Googlebotがこれをクロールすると、クロールを試みることができます

https://www.example.com/download-helloworld/

コンテンツが見つからない場合、ウェブマスターアカウントに404エラーのリンクが表示されますが、実際には存在しませんこちらを参照