web-dev-qa-db-ja.com

Google検索結果に表示されるレガシーサイトを削除するにはどうすればよいですか?

Googleがキャッシュすることを決定したレガシーURLを削除するにはどうすればよいですか?

新しいサイトでライブを行ったときに、スタッフが古いサイトにアクセスできるように、古いサイトをlegacy.example.comに移動しました。 robots.txtは更新されなかったため、Googleはそれをキャッシュすることにしました。

DNSにはワイルドカードリダイレクトがあるため、legacy.example.comに移動するとユーザーがライブページにリダイレクトされるため、Googleはまだこのサイトが存在すると考える可能性があります。

通常はrobots.txtを使用しますが、legacy.example.comは実際にはもう存在しません。

どのようなオプションがありますか? Google Search Consoleでプロパティlegacy.example.comを検証しました。ライブサイトのrobots.txtを変更してlegacy.example.comを何らかの形で削除する必要がありますか?

4
Lock

検索エンジンで見つけたくない古いコンテンツを新しいURLに移動する場合、いくつかのオプションがあります。

  • Robots.txtを使用して、サブドメイン全体のクロールをブロックします。 legacy.example.com/robots.txt put:

    User-Agent: *
    Disallow: /
    
  • そのドメインのコンテンツにアクセスするには、パスワード保護が必要です。 。htaccessで基本認証を実装できます。そのための手順を次に示します。 http://www.htaccesstools.com/articles/password-protection/
  • 会社のイントラネット上のサーバーでサブドメインをホストします。サーバーは外部からはアクセスできません。

他の答えは301リダイレクトを使用することを示唆していますが、それらは私には適切に聞こえません。コンテンツが元の場所にないため、検索エンジンはそれらを必要としません。それらを実装した場合、従業員がコンテンツを見ることができ、リダイレクトされないようにする必要があります。

また、標準的なタグはお勧めしません。レガシーサイトと現在のサイトのページが1対1で対応していれば、問題なく機能します。ただし、GoogleはSearch Consoleで、標準タグを無視し、インデックスに使用する非標準URLを選択していると報告します。私のサイトではかなり頻繁に発生するため、この種の問題を解決するための標準的なタグは以前ほど強力ではありません。

1

検索結果からlegacy.example.com/pageを削除し、それらの結果をexample.com/pageとして表示するには、301リダイレクトまたはrel = canonicalタグを使用します。

Legacy.example.com/pageをexample.com/pageに301リダイレクトすると、Googleがレガシーサブドメインページをクロールすると、example.com/pageが検索結果に表示されます。

また、rel.canonicalタグをすべてのレガシーサブドメインページに追加することも、example.com/pageのレガシーサブドメインなしでURLを指すサイト上のすべてのページに追加することもできます。これにより、サブドメインなしでページをランク付けするようGoogleに指示します。

Googleはこれらのページを重複したコンテンツとして認識し、どのページをランク付けするかわからないため、今のところ、どちらかを行う必要があります。最善の方法は、他の何らかの理由でレガシーサブドメインページが必要でない限り、301ツールを使用することです。

0
Michael d

まだ行っていない場合は、Google Webmaster Centralでサイトを確認してください。以下を含む各バージョンを必ず確認してください。-www。 -非www。 - https:// non-www (該当する場合)- https:// www 。 (該当する場合)

次に、どのバージョンを優先バージョンにするかを選択します1.サイトの優先バージョンをクリックします。2。サイト設定をクリックします(アイコンはギアボックスのように見えます) 3.次に、希望するドメインを選択します。

  1. 同じGWCアカウント内にとどまる
  2. Googleインデックスをクリックして、展開します
  3. 次に、[インデックスからURLを削除]をクリックします。

これは、robots.txtを使用してサブドメインをブロックするなどの以前の提案で実装されている場合、これらのURLが検索エンジンに表示されないようにするのに役立ちます。

スラックのようなツールはいつでも無料で使用でき、必要な人は誰でも会社のリソースを利用できるようにすることができます。

@StephenOstermiller以下は、Google Search Console内でドメインとサブドメインを別々に検証できることを証明する2つの画像です。

メインサイト: tjmfuneral site

サブドメイン:

tjmfuneral blog (under construction)

0
Josh Salganik