web-dev-qa-db-ja.com

スパムURLへのアクセスを禁止し、Googleのインデックスから削除するにはどうすればよいですか?

友達のウェブサイトの管理を始めたとき、free-nasscamd-server-31daygorilla-quentin-trollip-pdfなどの名前のガベージHTMLファイルがたくさん入ったフォルダを見つけました。誰かがそれらのファイルをハッキングしたと仮定してそこで、そのフォルダーとその中のすべてのHTMLファイルを削除し、他のすべての場所をチェックして、他に何も残っていないことを確認しました。

2か月後、ページが存在しないため404エラーを返すようになりましたが、アクセスログにまだ何らかの方法でアクセスしようとしているガベージURLが残っています。

Googleにアクセスしてsite:{url}と入力すると、{url}/pitchet-program-samsung-wave2/{url}/rogue-pirates-of-the-caribbean-themes-nokia-x3torrent/などのガベージURLも表示されます。

  1. これらのURLへのアクセス試行を防ぐにはどうすればよいですか?

  2. これらの不要なURLをGoogleから削除するにはどうすればよいですか?

1
user1795832

Robots.txt

数百から数千のURLがある場合、最も簡単な方法は robots.txt を使用してこれらのURLをGoogleに通知することですインデックスを作成しないでください。これにより、Googleは既にリストされているURLを確認し、時間内にそれらを削除することを期待します。 URLの削除には、ボリュームとGoogleがサイトにチェックインする頻度に応じて、数週間から数か月かかる場合があります。

ウェブマスターツール

数ダースのURLしかない場合、少量のURL削除を処理する最も簡単で簡単な方法は、Googleのウェブマスターツールを使用することです リクエストURL削除ツール 、これも単なるリクエストであり、開始には時間がかかる可能性があることに注意してください.

ハッキング防止

また、それらのファイルが最初にどのように取得されたかを調査する必要があります。ファイルを削除することは素晴らしい出発点ですが、ファイルがどのように取得されたかを理解することが、この問題が再び発生するのを防ぐための最も重要な要因です。あなたの友人のウェブホストはいくつかのセキュリティ問題についてコメントできるかもしれません、ほとんどの問題は SQLエクスプロイト 、古いプラグインとコンテンツ管理システム、弱い共有ホスティングセキュリティ、 パスワードの弱い使用brute-forcible ログインシステム(X回試行しても禁止されないシステム)。また、定期的に Web Apps Exploit Database にアクセスして、潜在的なセキュリティ問題を監視することもできます。

1
Simon Hayter

2つのこと:最初に、リソースが削除されたためにこれらのURLが404エラーになった場合、Googleはリソースが削除されたと判断する前にこれらのリソースを何度も取得しようとします。時間はかかりますが、これらのリソースを削除する最も簡単な方法です。オプションで、.htaccessファイルで指定し(Apacheを想定)、410エラーを返すことができます。これは高速ですが、作業が必要です。私のアドバイスは、少なくともGoogle、Bing、Yahoo!で404エラーが発生するようにすることです。など、これらは消えます。ただし、リンクなどが原因で他のリクエストを停止することはできません。 404エラーは迷惑であり、ログファイルと分析を汚染するので、それらを削除したいと思っています。 410エラーを除いて、最善の方法は404エラーを許可することです。これらのリクエストの一部が消えない可能性があります。現実には、それに対してできることは何もないかもしれません。

次に、ルートキットを含むファイルシステム全体のファイルレベルのアンチウイルススキャンを実行して、既存のウイルスがないことを確認します。同様に、ソフトウェアの脆弱性がまだ存在する可能性があります。特にPHPおよびPHPアプリケーションを含むインストール済みソフトウェアのバージョンを確認します。ソフトウェアを更新して、すべてのソフトウェアの安全なバージョンを実行していることを確認します。これらのファイルは真空状態では現れませんでした。穴を塞いでいることを確認してください。さもないと問題は続きます。

1
closetnoc