web-dev-qa-db-ja.com

404ページにつながるスパムリンクを削除するのに役立ちます

ある日、私のサイトがハッキングされました。誰かが私のサイトにスパムページを挿入しました。問題を解決し、データベースをクリーンアップし、ログイン領域を保護しました。しかし、これらのリンクはGoogleを含むすべての検索エンジンにまだ存在し、404ページにつながっています。

サイトに8つの有効なページがあるXMLサイトマップがあります。このサイトマップはWebmastersページに存在し、2015年8月23日に更新され、8ページしか表示されていません。ただし、検索エンジンはこれらのスパムリンクを削除しません。

また、Google Websmasters ToolのLinks削除ツールを試してみましたが、約1か月間有効でしたが、現在は有効期限が切れており、これらのリンクが再び表示されます。これらのスパムリンクを検索エンジンから削除するにはどうすればよいですか?

1
Kirill Ryzhkov

動作に違いがあることに注意してください。

サイトを再起動し、301ページの新しいページにリダイレクトした後、404エラーを発行することを決めましたが、カスタムHTMLで失われた可能性のあるトラフィックを取り戻すことにしました。 404ページは期待どおりに機能しましたが、カスタム404 HTMLをドロップすると、2ページが404を返すだけでなく、HTMLコンテンツ(ソフト)を返し、インデックス付けされたままであることがわかりました。これらのページがHTMLをまったく使用せずに404を返した場合(ハード)、Googleは注意します。

実際には2つのソフト404ページがあります。 1つは404をコードで発行することで、もう1つはWebサーバーが発行するカスタムページを実際に作成することです。コードを使用すると、404ヘッダーは正しく発行される場合がありますが、HTMLを発行する場合、Googleはそれをあまり深刻に受け取らない可能性があります。これは言語ごとの言語で行われる場合があります。はい。 404を取得しますが、Googleが別の方法で処理できるようです。可能な場合は、CMSではなくWebサーバーに404を発行させる方がはるかに優れています。

Googleが404を処理する方法で404を処理する方法に違いがあるようです。これら2つのページをまだ修正しておらず、Googleから検索結果を取得していますが、適切な404応答を返します。もちろん修正することは私のリストにあります-私は少し遅いです。

ページが存在しない場合、最も簡単な方法は、HTMLなしでWebサーバーを自然に使用できるようにすることです。これは、すべてのWebサーバーのデフォルトです。ただし、一部のCMSはソフト404を提供するように設定されています。これは、本来失われるトラフィックを再キャプチャするためです。 Googleは理由からソフト404を好みませんが、ソフト404には価値があることを理解しています。 Googleはハード404を好みます。

なくなったページに410を提供することは技術的には正しいです。 Googleは404と410を別々に扱います。 410を返すページはすぐにインデックスからリストから外され、再度要求されることはありません(通常).

リンクがある限り、これらのページは定期的に再試行される可能性があることに注意してください。それは当然のことですが、これがどのように機能するかです。 Googleがリンクをたどり、ページがインデックスにないためにインデックスから削除した場合、Googleはリンクをデッドリンクとしてマークします(用語のダングリング)。通常、Googleは、410または404エラーが何度も発生した後、リンクを再試行しません。ただし、新しいリンクが表示された場合、Googleは新しいリンクのプロセスを最初からやり直します。

410または404を返し、HTMLを返さない限り、すべて問題ありません。ただし、ページに410を発行できる場合は、それが最適です。確かに面倒ではなく、これらのページをより迅速にリストから外すのに役立ちます。

0
closetnoc