私のWordPressブログは完全に複製されています。そのクローンサイトは私のブログでリアルタイムに更新されています。誰かが実際にそれができることに驚いています。
検索エンジンのランキングに悪影響を及ぼさないようにするにはどうすればよいですか?そのサイトをインデックスに登録しないようにGoogleに指示する方法はありますか?
サーバー側のスクリプトを介してサイトを読み込むだけです。必要なことは、.htaccessを介してサーバーのIPアドレスをブロックすることだけです。サーバーのアクセスログを開き、そのサイトのクローンページを開き、新しいエントリのログを表示すると、IPアドレスがわかります。
また、GoogleにDMCAリクエストを送信しても問題はありませんが、IPアドレスをブロックするとそのコンテンツがすぐに消えるため、これは実際には必要ありません。
(@ Johnの答えに加えて)
そのサイトをインデックスに登録しないようにGoogleに指示する方法はありますか?
theyがクローンeverything(XMLを含む)サイトマップ* 1)、theyはrobots.txtファイルのクローンを作成していません。実際、thatサイトのrobots.txtは、すべてのクロールを積極的にブロックしています!そのため、この点で行うことは何もないようです。 thatドメインでサイト検索を実行すると、裸のドメインと、robots.txtによってブロックされていることを示す通知のみが返されます。
(むしろ、彼らの意図がこれにどのようになるのか興味がありますか?robots.txtで間違いを犯したと思われるかもしれません-そしておそらくそうです-しかし、これは私にとって意図的な例外のように見えますか?)
また、XMLサイトマップのクローンが作成されている間は、XMLサイトマップはそれらのURLを(メインサイトページで行っているように)更新しないため、サイトを指し示しています。
* 1 XMLサイトマップについて。あなたのサイトでは "sitemap.xml"は実際には "sitemap_index.xml"へのリダイレクトであり、クローンサイトは実際にリダイレクトをクローンしています...これはあなたのサイトにリダイレクトします! (確かに間違いです。)「sitemap_index.xml」は単なるインデックスであり、他の4つのサイトマップにリンクしています。これらの実際のサイトマップのいずれかがクローンサイトで直接要求された場合、それらは正しくクローンされ、URLが更新されます。ただし、これらのサイトマップは、「sitemap.xml」の最初のリダイレクトのために、複製されたサイトで検出される可能性は低いと言っていました。 (?)彼らが「sitemap_index.xml」を直接送信した場合、それは明らかにリダイレクトを回避するでしょう。
サイトがあなたへのバックリンクを生成する場合、Google Disavowツールを使用することが重要です。そうしないと、アルゴリズムは関係なく、あなたに対して機能します。
https://www.google.com/webmasters/tools/disavow-links-main
.txtファイルを作成して追加します:
domain:thedamnsitethatcloned.com
次に、ウェブマスターツールを介してGoogleにアップロードします。
この問題を解決するために私がとるステップは、まさにここにあります。多くのウェブマスターがこの問題に直面していることを知っています。私は以前にこの問題を抱えていましたが、Googleには(皮肉なことに)直接的な答えはないようです(だから私は助けたいです)。マット・カッツはあなたがこれらの問題について聞くことになっている男ですが、彼の言うことを聞くことは、燃えている家の中のスーパーコンピューターに対してチェスのゲームに勝とうとするようなものです(見つけられません)。
ショートカッツ:
私の最初の答えはドメインを否認することでしたが、否認する必要があることを忘れました。
(Googleはそれらを2つの別個のドメインとしてカウントします)。