web-dev-qa-db-ja.com

Googleインデックスのサブドメインを防ぐ

IPが1つしかないcPanelホスティングがあります。私はすべてのTLDSをこのサーバーに向ける過程にあります。

「アドオンドメイン」を作成し、作成元のすべてのフォルダーは、ルートウェブサイト「/ home/user/public_html/client /」のサブドメイン「domain1.com」、「domain2.com」にありますが、 「domain1.maindomain.com」からアクセスします。私が心配しているのは、グーグルがこれらのサブドメインをインデックス化するかどうかです。

これを防ぐにはどうすればよいですか?このような書き換えルールで十分ですか?

 RewriteCond 
%{HTTP_Host}のRewriteEngine!^ www\.domainpointtosubfolder\.com $ [NC] RewriteRule 
 ^(。*)$ http://www.domainpointtosubfolder。 com/$ 1 [L、R = 301] 

または、より良い方法がありますか?

2
tom

CPanelを使用しない場合、これを行う正しい方法は、各ドメインを独自のディレクトリに配置することです。 Apacheは、cPanelが設定する方法で重複ドメインを処理するように実際に設計されていません。これはcPanelの制限のようです。

有効なテクニックの1つは、ドメインのallを「ドメインに追加」として扱うことです。 cPanelのメインドメイン名を、実際にはDNSエントリのないサブドメインに設定します。 allmysites.example.comのようなもの。そうすると、Googleは実際にメインディレクトリをクロールできなくなります。ディレクトリ構造は次のようになります。

  • allmysites(DNSを介してアクセスできないallmysites.example.comを提供)
    • site1(site1.example.comを提供)
    • site2(site2.example.comを提供)
    • site3(site3.example.comを提供)
1

Googleは、すべての適切なWebクローラーと同様に、Robots Exclusion Standard(robots.txt)を尊重します。すべてのドメインに個別のフォルダーを使用しないという制限があり、すべてのドメインをcPanel「ドメインに追加」として扱いたくない場合は、追加することでこれらのフォルダーのインデックス作成を防止できます(ただし、フォルダーへのアクセスはできません) /home/user/public_html/client/robots.txt

User-agent: *
Disallow: /site1-directory/
Disallow: /site2-directory/

追加のドメインには異なるルートがあるため、このrobots.txtはメインサイトにのみ影響します。

0
Esa Jokinen