web-dev-qa-db-ja.com

Googleの<noindex>タグ

ページの特定の部分をインデックスに登録しないようにGoogleに伝えたいと思います。 Yandex(ロシアのSE)には、<noindex>という非常に便利なタグがあります。 Googleでそれを行うにはどうすればよいですか?

20
teslasimus

Robots.txtによってブロックされているiframeにそれらの部分を配置することで、Googleがページの一部を表示しないようにすることができます。

robots.txt

Disallow: /iframes/

index.html

This text is crawlable, but now you'll see 
text that search engines can't see:
<iframe src="/iframes/hidden.html" width="100%" height=300 scrolling=no>

/iframes/hidden.html

Search engines cannot see this text.

Iframeを使用する代わりに、AJAXを使用して隠しファイルの内容を読み込むことができます。以下は、jquery ajaxを使用してそうする例です。

his text is crawlable, but now you'll see 
text that search engines can't see:
<div id="hidden"></div>
<script>
    $.get(
        "/iframes/hidden.html",
        function(data){$('#hidden').html(data)},
    );
</script>
7

ウィキペディアによると1、いくつかのルールがありますいくつかのスパイダーが続きます:

<!--googleoff: all-->
This should not be indexed by Google. Though its main spider, Googlebot,
might ignore that hint.
<!--googleon: all-->

<div class="robots-nocontent">Yahoo bots won't index this.</div>

<noindex>Yandex bots ignore this text.</noindex>
<!--noindex-->They will ignore this, too.<!--/noindex-->

残念ながら、彼らはそれが思われる単一の基準に同意することができませんでした–そして私の知る限り、すべてのスパイダーを遠ざけるものは何もありません...

googleoff:コメントはさまざまなオプションをサポートしているようですが、完全なリストがどこにあるかはわかりません。少なくともあります:

  • all:ブロックを完全に無視します
  • index:コンテンツはGoogleのインデックスに登録されません
  • アンカー:リンクのアンカーテキストはターゲットページに関連付けられません
  • スニペット:テキストは、検索結果のスニペットの作成には使用されません

(少なくともGoogleの場合)これは検索インデックスにのみ影響し、ページのランキングなどには影響しないことにも注意してください。さらに、 Stephen Ostermiller として正しく指摘以下の彼のコメントで、googleonおよびgoogleoffGoogle検索アプライアンスでのみ機能し、通常のGooglebotには影響しません 残念ながら。

Yahooの部分にも記事があります2 (そしてYandexが<noindex>も尊重することを説明する記事6)。 googleoff:の部分については、 この回答 、および関連情報のほとんどを取得した記事も参照してください。


さらに、 Googleウェブマスターツールrel=nofollow属性の使用をお勧めします4 特定のリンク(たとえば、ログインやサインアップなど、ボットがアクセスできない/役に立たないページへの広告またはリンク)。つまり、 HTML a rel Attribute はGoogleボットによって尊重される必要があります。ただし、これは主に検索ランク自体ではなく、ページランクに関連しています。残念ながら、rel=noindexがないようです5,7。この属性を他の要素にも使用できるかどうかもわかりません(例:<DIV REL="noindex">)。しかし、クローラーが「noindex」を尊重しない限り、それも意味がありません。


その他の参照:


1ウィキペディア:Noindex
2Webページのどのセクションが検索エンジンを無視する可能性がありますか?
ページの特定の部分にインデックスを付けないようにGoogleに指示してください
4特定のリンクにはrel = "nofollow"を使用
5<a href=“http://name.com” rel=“noindex, nofollow”>name</a>を使用するのは良い考えですか?
6HTMLタグの使用—Yandex.Help。Webmaster
7既存のREL値

20
Izzy

いいえ、 Googleは<noindex>タグをサポートしていません 。実質的に誰もしません。

3
John Conde