Google Webmaster Toolsは、私が開発したWebサイトに存在したことのない.htmlページのクロールエラー「404(Not Found)」を報告しています。報告されているページは「tyuiabmog.html」であり、人間によって命名されたようには聞こえません!
Googleがこの存在しないページをどのように見つけたのか、なぜクロールしようとしているのかについて、誰かが私に光を当てるのを手伝ってもらえますか?
Googleや他の検索エンジンがこれを実行して、Webサイトのデフォルトの404動作を発見すると信じています。ランダムに名前が付けられたページにアクセスします具体的には存在しないためであるため、404ページを、インデックスを作成する通常のページと区別できます。これにより、たとえば404ステータスコードを返さないサーバーを正しくクロールできます。
WMTでページが報告された場合、ボットが実際にこのページを正常にスキャンしようとしたことを意味します。エラーをクリックすると、ページのリンク元を確認できます。 Web全体にWebサイトへの無効なリンクが存在する可能性があるため、調査し、必要に応じてこれらのWebサイトの所有者に通知する必要があります。
選択された答えは、ボットがどのように404を見つけようとするのかを示しているようですが、これは質問の内容ではないようです。
一部のページ(サイトまたは外部)がドメイン上のそのファイルにリンクしている可能性があります。そのファイルが存在しないため、404エラーが発生します。
この種のエラーは、以前はエラーのある正規のタグにポップアップ表示されていました。
ウェブマスターツールで404エラーを見つけて、[リンク元]に移動します。 Linked From URLをプルアップし、そのページでソースを表示します。必ず404エラーリンクのソースを検索してください-隠されているかもしれませんが、そこにあるはずです。
また、Googleウェブマスターツールの404ページからリンクされた404ページに出会いました。どうすればいいのかわかりません。
<a href="helloworld.pdf" onClick="_gaq.Push(['_trackPageview','/download-helloworld']);">Hello World PDF</a>
Googlebotがこれをクロールすると、クロールを試みることができます
https://www.example.com/download-helloworld/
コンテンツが見つからない場合、ウェブマスターアカウントに404エラーのリンクが表示されますが、実際には存在しません こちらを参照