web-dev-qa-db-ja.com

Googleが主にJavascriptによって生成されたコンテンツをインデックスに登録するための最良のアプローチ

顧客がJavascriptタグをWebサイトにドロップしてコンテンツを生成できるアプリを開発しています。 Googleにこのコンテンツのインデックスを作成し、サイトのURLに関連付ける最良の方法は何ですか。

GoogleはJSを実行しないことを知っているので、さまざまな角度を考えています。 Googleは、顧客のサイトではなく、コンテンツがコンプしているサイトのコンテンツにインデックスを付けることができますが、その後、明らかに間違ったURLでインデックスが作成されます。 Googleに別のURLを表示させることはできますか? Googleに別のサイトのコンテンツのインデックスを作成させ、それに関連付けさせる別のアプローチはありますか

制約は次のとおりです。

  • お客様のWebサイトは、コードの1つのセクション(理想的にはJSタグ)のみをドロップできます。
  • 別のサイトではありますが、元のコンテンツを完全に制御できます。
  • 顧客のWebサイトでは、これを具体的に解決するためのサーバー側の処理を実行できません。

Web訪問者は、サイトを表示するときにJSが生成したコンテンツを見るのが理想ですが、Googleボットは別のWebページ(同じコンテンツですが、生のソースから)からコンテンツを取得します。 JSなしでこれを行う方法がわかりません。

5
Sean Coleman

私が理解していることから、あなたはあなたのサイトからクライアントサイトにコンテンツを提供しており、クライアントサイトにコンテンツの担当者を取得してほしいですか?

Googleは一部のJavaScriptを解析しますが、すべてではなく一貫性もあります。最善の方法は、@ Shazが提供するリンク http://code.google.com/web/ajaxcrawling をたどり、クライアントと協力してそれを実装することです。

残念ながら、それはクライアントのURL構造にいくつかの制限を課しますが、これを行う他の方法は知りません。

1
Dan Blows

「タグ」は、A要素とjavascriptのスニペットの組み合わせにすることができます。 A要素のhrefは、検索エンジンやjavascriptを使用しない検索エンジンで表示されることを意図した、コンテンツを含むクロール可能なページを指します。 javascriptを使用するユーザーの場合、A要素は動的コンテンツに置き換えられます(hrefを解析して、配信するコンテンツを決定し、サイトにドロップしたい人のために物事を簡素化します)。 JavaScriptを持たないユーザー(したがって検索エンジン)には、コンテンツへのリンクが表示されます。

また、コンテンツページで、javascriptを使用してユーザーを動的ページに戻すことができます。そうすれば、誰かが検索エンジンを介して到着した場合、そこにリンクしているページに移動します。

動的コンテンツを自分のサイトにドロップするのが複雑にならないように設定するのは難しいですが、それほど難しくないはずです。

0
rob

2015年現在、GooglebotはJavaScriptの実行を含むページをレンダリングしています。次に、表示されるすべてのコンテンツ(静的および生成)のインデックスを作成します。 JavaScriptで生成されたコンテンツがGooglebotに表示されるようにするには:

  • CSSファイルとJSファイルがrobots.txtによってブロックされていないことを確認してください
  • Googleウェブマスターツールで Fetch as Google の「取得とレンダリング」機能を使用します。  GooglebotがページのJavaScript生成コンテンツを表示できることを確認してください。

GooglebotはJavaScriptで生成されたコンテンツを見るのがとても上手になったので、 それを防ぐ方法 を尋ねなければなりませんでした。

0