web-dev-qa-db-ja.com

Googleが保護されたコンテンツのインデックスを作成できるようにする方法は?

私は自分のサイトで作業していますが、ユーザーがログインする必要があるため、Googleがサイトのインデックスを作成するのは困難です。なぜなら、コンテンツの90%をオンラインにする必要があるからです。

そこで、66.249.66.1から66.249.71.206の間にある場合、サイトに入るIPを探すスクリプトを作成しました。 IPがこの範囲内にある場合、「Googleボット」をオンラインに設定すると、通常のユーザーに表示されるすべてのページを表示できるようになります。

これはいいアイデアですか?さらにIP範囲がありますか?これらのIP範囲を信頼できますか?

4
Kilise

これは良い考えではありません。いいえ、これらのIP範囲を信頼することはできません。 Googleが使用するIPアドレスは公開されていません。ただし、一部/ほとんどの検索エンジンクローラーは、IPアドレスで逆DNSルックアップを実行することで識別できます。
googlebotの例:66.249.64.0にはcrawl-66-249-64-0.googlebot.comへのPTRレコードがあり、googlebot.comのサブドメインへのPTRレコードを持つIPは使用されるIPアドレスですgooglebotによる。

あなたがしているのは、あるコンテンツのセットをGoogleに見せ、別のコンテンツのセットを実際のユーザーに見せることです。これはひどく眉をひそめられ、クローキングと呼ばれます。

Matt Cuttsの決定的なクローキングビデオ をご覧ください。

最善のオプションは、公開したいコンテンツのサブセットを取得し、このコンテンツを検索エンジンとユーザーに公開するサイトの一部を作成することです。ユーザーがもっと見たい場合はログインする必要があります。 。

6
joesk

あなたがすることは良い考えではなく、クローキングとして罰せられることがあります。

2017年10月1日までのベストプラクティスは、前の回答で述べたように、First Click Freeでした。ただし、2017年10月以降、これは変更されています。

現在、Googleは Flexible Sampling を有料のコンテンツまたは無料で利用できないコンテンツに使用しています。

基本的にGoogleでは、サイト運営者が制限なしに提供するコンテンツの量を決定できますが、それに応じてコンテンツをマークアップする必要があります。したがって、Googleはどのコンテンツが保護されているかを認識し、クローキングに対してサイトを罰することはありません。出版社は、限られた数のページまたはページの一部のみを無料で提供し、残りを制限することを決定できます。

Googleは、ロボットがそれらを見ることができる場合、すべての制限されたページにインデックスを付けます。ただし、それらが保護されているという事実は、Googleだけが知っている方法でランキングに影響する可能性があります。

3
IXN

Googleに制限付きコンテンツへのアクセスを許可する場合は、Googleの First Click Free を使用できます。

First Click Freeは、コンテンツを保護し、Googleの検索インデックスを含めることができるように設計されています。 First Click Freeを実装するには、Google検索でページを見つけたすべてのユーザーに、ユーザーがGoogleの検索結果で見つけたドキュメントの全文と、GoogleのクローラーがWebで見つけたものを、登録や購読を要求せずに表示できるようにする必要がありますそのコンテンツを参照してください。コンテンツへのユーザーの最初のクリックは無料であり、ログインする必要はありません。ただし、ユーザーがそのページからコンテンツサイトの別のセクションにクリックしようとすると、ログインまたは支払いまたは登録リクエストでユーザーをブロックできます。

3
Nat Ryall