Googleがキャッシュすることを決定したレガシーURLを削除するにはどうすればよいですか?
新しいサイトでライブを行ったときに、スタッフが古いサイトにアクセスできるように、古いサイトをlegacy.example.com
に移動しました。 robots.txtは更新されなかったため、Googleはそれをキャッシュすることにしました。
DNSにはワイルドカードリダイレクトがあるため、legacy.example.com
に移動するとユーザーがライブページにリダイレクトされるため、Googleはまだこのサイトが存在すると考える可能性があります。
通常はrobots.txtを使用しますが、legacy.example.com
は実際にはもう存在しません。
どのようなオプションがありますか? Google Search Consoleでプロパティlegacy.example.com
を検証しました。ライブサイトのrobots.txtを変更してlegacy.example.com
を何らかの形で削除する必要がありますか?
検索エンジンで見つけたくない古いコンテンツを新しいURLに移動する場合、いくつかのオプションがあります。
Robots.txtを使用して、サブドメイン全体のクロールをブロックします。 legacy.example.com/robots.txt
put:
User-Agent: *
Disallow: /
他の答えは301リダイレクトを使用することを示唆していますが、それらは私には適切に聞こえません。コンテンツが元の場所にないため、検索エンジンはそれらを必要としません。それらを実装した場合、従業員がコンテンツを見ることができ、リダイレクトされないようにする必要があります。
また、標準的なタグはお勧めしません。レガシーサイトと現在のサイトのページが1対1で対応していれば、問題なく機能します。ただし、GoogleはSearch Consoleで、標準タグを無視し、インデックスに使用する非標準URLを選択していると報告します。私のサイトではかなり頻繁に発生するため、この種の問題を解決するための標準的なタグは以前ほど強力ではありません。
検索結果からlegacy.example.com/pageを削除し、それらの結果をexample.com/pageとして表示するには、301リダイレクトまたはrel = canonicalタグを使用します。
Legacy.example.com/pageをexample.com/pageに301リダイレクトすると、Googleがレガシーサブドメインページをクロールすると、example.com/pageが検索結果に表示されます。
また、rel.canonicalタグをすべてのレガシーサブドメインページに追加することも、example.com/pageのレガシーサブドメインなしでURLを指すサイト上のすべてのページに追加することもできます。これにより、サブドメインなしでページをランク付けするようGoogleに指示します。
Googleはこれらのページを重複したコンテンツとして認識し、どのページをランク付けするかわからないため、今のところ、どちらかを行う必要があります。最善の方法は、他の何らかの理由でレガシーサブドメインページが必要でない限り、301ツールを使用することです。
まだ行っていない場合は、Google Webmaster Centralでサイトを確認してください。以下を含む各バージョンを必ず確認してください。-www。 -非www。 - https:// non-www (該当する場合)- https:// www 。 (該当する場合)
次に、どのバージョンを優先バージョンにするかを選択します1.サイトの優先バージョンをクリックします。2。サイト設定をクリックします(アイコンはギアボックスのように見えます) 3.次に、希望するドメインを選択します。
これは、robots.txtを使用してサブドメインをブロックするなどの以前の提案で実装されている場合、これらのURLが検索エンジンに表示されないようにするのに役立ちます。
スラックのようなツールはいつでも無料で使用でき、必要な人は誰でも会社のリソースを利用できるようにすることができます。
@StephenOstermiller以下は、Google Search Console内でドメインとサブドメインを別々に検証できることを証明する2つの画像です。
サブドメイン: