web-dev-qa-db-ja.com

Blogspot noindex検索ラベル

Blogspotのデフォルトrobots.txtは次のとおりです。

User-agent: Mediapartners-Google
Disallow: 
User-agent: *
Disallow: /search
Allow: /
Sitemap: http://castbird-sourcing.blogspot.com/feeds/posts/default?orderby=UPDATED

しかし、 site:castbird-sourcing.blogspot.com の場合、Google検索は次のように表示されます。

In order to show you the most relevant results, we have omitted some entries very similar to the 32 already displayed.
If you like, you can repeat the search with the omitted results included.

結果を展開すると、次のようなものが表示されます。

castbird-sourcing.blogspot.com/search/label/gadget
A description for this result is not available because of this site's robots.txt – learn more.

私の質問は:

  1. これは、すでに表示されている32個の問題と非常によく似ており、一般にSEOに害を及ぼしますか?
  2. googlebotは/searchのすべてを既に無視してはいけませんか? Googleがこれらのページのインデックスを作成するのはなぜですか?
  3. Googleの結果からインデックス付き/searchリンクを完全に削除するにはどうすればよいですか?
2
Peter

これは、すでに表示されている32の問題と非常によく似ており、一般的なseoに害を及ぼしますか?

Googleは、ユーザーのクエリやその他のアルゴリズムに基づいて、類似したコンテンツを持つページの中でどのページを表示するかを決定します。たとえば、ユーザーがガジェットを検索し、ガジェットのラベルページがある場合、ブログの特定の投稿ページよりも適切な結果になります。

this ページを参照してください。

マット・カッツは、それについて強調するべきではないと2度言った。悪いスパムではない場合、Googleは重複したコンテンツを無視するかもしれない。マットは動画で、「複製したコンテンツがスパムまたはキーワードの乱用でない限り、これについては強調しません」と述べました。

googlebotはすべての/ searchをすでに無視してはいけませんか?なぜグーグルがこれらのページのインデックスを作成するのですか?

this ページを参照してください。

Googleはrobots.txtによってブロックされたページのコンテンツをクロールまたはインデックス登録しませんが、Web上の他のページでURLが見つかった場合でもURLをインデックス登録する場合があります。その結果、ページのURLと、サイトへのリンクのアンカーテキストや、オープンディレクトリプロジェクト(www.dmoz.org)のタイトルなど、他の公開情報を潜在的にGoogle検索結果に表示できます。

Googleの結果からインデックス付きの/ searchリンクを完全に削除するにはどうすればよいですか?

動作するかどうかはわかりませんが、メソッド here を試すことができます。ただし、ページをそのままにしておくと、seoに害を及ぼさないことをお勧めします。 Googleにはラベル検索ページがデータベースに追加されていますが、SERPで良好に機能するBloggerブログが多数あります。

2
Ranjith