私は通常、負荷分散を通じてアクセスされるWebサイトで作業しています。ただし、各サーバーへの直接URLもあります。
最近、Googleはサーバーへの直接URLのインデックス作成を開始しました。これは、ユーザーが各サーバーに直接アクセスすることを望まないためです(一部のサーバーがメンテナンスのためにダウンした場合)。
負荷分散URLを指す正規のリンクタグを修正しました。 sitemap.xml内のすべてのリンクは、負荷分散URLを指します。そのため、GoogleがどのようにしてダイレクトサーバーURLを手に入れたかはわかりません。
明確にするために:負荷分散はfoo.com
です。サイト上のすべてのリンクはこのURLを使用します。サイトマップと標準タグも同様です。
ただし、Googleは引き続きfoo.server01.webhost.com
とfoo.server02.webhost.com
のインデックスを作成します
さまざまな理由により、foo.server**.webhost.com
からfoo.com
への301リダイレクトを追加できません。
Google Search ConsoleですべてのURLを所有していることを確認する必要がありますか?または、他の設定がいくつか欠落していますか?
...最近、Googleはサーバーへの直接URLのインデックス作成を開始しましたが、これは悪いことです...
rel="canonical"
を含むリンクタグを削除し、HTMLの<head>
と</head>
の間に次のタグを配置します。
<meta name="ROBOTS" content="NOINDEX">
これにより、すべての検索エンジンにページのインデックスを作成しないよう指示します。一部のrel=canonical
を理解および/または処理することさえできないため、これはすべての検索エンジンで動作するはずです。次に、変更を保存した後、リクエストを処理するために検索エンジンに数時間から数週間を与えます。
ここに詳細情報があります: http://www.metatags.org/meta_name_robots