web-dev-qa-db-ja.com

ロボットに特定のテキストを無視させる方法はありますか?

私は私のブログを持っています(あなたが望むなら、私のプロフィールからそれを見ることができます)、そしてそれは新鮮です、そしてグーグルロボットが結果を解析しています。

結果は私を驚かせました。 「コメントRSS」や「ポストフィード」などのリンクにテキストを使用しているため、私のサイトで最も一般的な2つの単語は「rss」と「feed」です。これらの2つの単語はすべての投稿に表示されますが、他の単語はよりまれになります。

これらのリンクをGoogleの解析から非表示にする方法はありますか?テクニカルリンクにインデックスを付けたくありません。コンテンツ、タイトル、説明のみをインデックスに登録したい。このテキストを画像に置き換える以外のものを探しています。

私は2007年からGoogleでいくつかの古い議論を見つけました(3年で多くのことが変わったかもしれないと思います、うまくいけばこれも)

この質問はrobots.txtとGoogleにページを無視させる方法についてではありません。それは、ページの小さな部分を無視するようにすること、または人間に見えてロボットには見えないように部分を変換することです。

27
AlexanderMP

googleongoogleoffを使用して、ドキュメントの一部にインデックスを付けないようにGoogleに指示する簡単な方法があります。

<p>This is normal (X)HTML content that will be indexed by Google.</p>

<!--googleoff: index-->

<p>This (X)HTML content will NOT be indexed by Google.</p>

<!--googleon: index-->

この例では、2番目の段落はGoogleによってインデックスに登録されません。 「index」パラメータに注意してください。これは次のいずれかに設定できます。

  • index —「googleoff: index」で囲まれたコンテンツはGoogleによってインデックスに登録されません

    anchor —「googleoff: anchor」領域内のリンクのアンカーテキストはターゲットページに関連付けられません

    snippet —「googleoff: snippet」で囲まれたコンテンツは、検索結果のスニペットの作成には使用されません

    all —「googleoff: all」で囲まれたコンテンツはすべてで扱われます

ソース

16
Ormoz

私は米国の何千もの学校名でトップ3のグーグルランキングのサイトで働いており、SEOを保護するために多くの仕事をしています。あなたができる3つの主なことがあります(それらはおそらく時間の無駄です、読み続けてください):

  • 軽視したいものをHTMLの下部に移動し、CSSを使用するか、読者に見せたい場所に配置します。これはクローラーからそれを隠すことはありませんが、彼らはそれをより低く評価します。
  • それらのリンクを画像に置き換えます(あなたはそれをしたくないと言いますが、理由を説明しないでください)
  • これらのリンクを削除して、別のページをクローラーに提供します。コンテンツが基本的にブラウザに表示されるものと同じである限り、これについてブラックハットはありません。ユーザーに表示されるものとは大幅に異なるページを提供する場合、検索エンジンはあなたを助けますが、ページクローラーインデックスのバージョンからRSSリンクを削除した場合、問題はありません。

とは言うものの、クローラーは賢く、パーマリンクとRSSリンクでいっぱいのサイトはあなただけではありません。彼らは文脈を気にし、あなたの見出しや本文で用語やフレーズを探します。彼らはあなたのブログがRSSではなくテクノロジーに関するものであると判断する方法を知っています。これらのリンクがSEOに悪影響を与えることは非常に疑わしいです。実際に解決しようとしている問題は何ですか?

SEOを構築したい場合は、読者にどのような価値を提供するかを理解し、それについて書いてください。他の人があなたのブログにリンクするように導く興味深いことを言うと、クローラーはあなたが人々が大切にしている情報源であることを理解します。読者が見たり理解したりすることについてもっと考え、あなたが見ていることについては考えないでください考えるクローラーが見るもの。

グーグルクローラーは賢いですが、それらをプログラムする人が最も賢いです。人間は常にページで何が賢明であるかを見て、彼らはいくつかの素晴らしいコンテンツを持ち、最もまれでユニークなブログに時間を費やします。それはすべて常識、人々があなたのブログをどのように訪問するか、そして彼らがどれだけの時間を費やすかについてです。 Googleは同じ方法で検索結果を測定します。毎日の訪問数が増え、サイトのコンテンツが改善されて毎日更新されると、ページのランキングも上がります。このページには、「回答」という言葉が複数回繰り返されています。インデックスが作成されないという意味ではありません。それは誰にとってもどれほど役立つかです。私はそれがあなたにいくつかのアイデアを与えることを願っています

1
Usman Ahmad

「googleon」と「googleoff」は、Google検索アプライアンスでのみサポートされています(独自の検索結果をホストする場合、通常は独自の内部Webサイト用)。

これらは、GoogleのWeb検索ではまったくサポートされていません。ですから、そうすることは控えてください。あいまいさが生じる可能性があるため、正解としてマークするべきではないと思います。

ここで、Googleにページの一部を除外させるには、そのコンテンツをexcluded.htmlなどの別のファイルに配置し、iframeを使用してそのコンテンツをホストページに表示する必要があります。

Iframeタグは別のファイルからコンテンツを取得し、それをホストページに挿入します。今のところ他に利用できる方法はないと思います。

1
VishalQuery

まず、問題について考えます。グーグルが「RSS」があなたのコンテンツの残りが少し浅くて拡大する必要があることを示唆するかもしれない主なキーワードであると思うならば。おそらくこれがあなたの注意の焦点になるはずです。あなたのコンテンツの残りが豊富であるならば、検索エンジンはタイトルと見出しからページが何であるかを知っているべきなので、私は問題について心配しません。 RSSなどが見出し、太字、または強いタグに含まれていないことを確認してください。

第二に、あなたが正しく言及しているように、画像は代替テキストなしでスクリーンリーダーに評価できないため、おそらく使用したくないでしょう。代替テキストまたはサポートテキストがある場合は、キーワードを追加し直します。ただし、arialiveは回避に役立つ場合があります。この問題ですが、私はアクセシビリティの専門家ではありません。

オプション

  • JavaScriptを使用して、そのビットのコンテンツを記述します(おそらく、ロード後にajaxします)。グーグルのような検索エンジンはJavaScriptを実行できますが、JSで書かれたコンテンツをそれほど高く評価することはないと思います。
  • コンテンツを言い換えたり、重複を削除したりすると、1つの目立つRSSフィードリンクが、ページの周りに点在するいくつかの小さなリンクよりも優れている場合があります。
  • Css content属性をpseudo:beforeまたは:afterとともに使用して、コンテンツを追加します。ボットがCSSのコンテンツ属性の単語にインデックスを付け、各ページに関連するコンテンツの価値を知っているかどうかはわかりませんが、そうは思われません。 RSSのような単語をCSSに入れると、基本的にはHTMLではなくスタイルのものであると言えます。したがって、エンジンがインデックスを作成しても、RSSに多くの/価値を追加することはありません。たとえば、HTMLとCSSは次のようになります。

    <a href="/my-feed.rss" class="add-text"></a>
    
    .add-text:after { content:'View my RSS feed'; }
    

上記は古いバージョンのIEでは機能しないため、気になる場合はIEバージョンのコメントが必要になる場合があります。

1
Dan Knight

ブラックハットのサーバー側の方法以外にできることはありません。なぜこれらの単語が頻繁にあるのかを調べて、サイトからそれらの一部を削除することをお勧めします。

以前はJSを使用してgooglebotから物事を「隠す」ことができましたが、現在はJSを解析することはできません。 ( http://www.webmasterworld.com/google/4159807.htm

1
Aaron Harun

インデックス作成ロボットを制御できるのは、robots.txtファイルだけです。 このドキュメント 、Googleによってリンクされている ファイルの使用法を説明するページ を参照してください。

基本的に、特定のリンクとURLを禁止できますが、必ずしもキーワードとは限りません。

1
JYelton

いいえ、そのようなものは実際にはありません。サーバー側の手法にはさまざまなものがありますが、Googleが、Webサイトの訪問者に提供するのとは異なるテキストをボットに提供していることに気付いた場合、ペナルティが科せられます。

0
Charles