web-dev-qa-db-ja.com

Googleクローラーと動的なWebSocket Webサイト

ウェブページの開発を終えて初めて検討している大きな問題があります。私のページはスケルトンHTMLのみで書かれています。私のサイトの実際のコンテンツはすべて、websocketsを介して送信されます。クライアント側のJavaScriptは、この情報をキャプチャして、ページを動的に構築します。

これは、websocketの指示を使用して、すべてを迅速かつリアルタイムで変更できるようにするために行いました。

すべてのコードはエラーなしで機能します。しかし、Googleクローラーで取得すると、ボットが見るのはコンテンツのないベースHTMLだけであることがわかりました。

これを回避するためにどのような方法を使用できるかわかりませんか?私が使用したこのアプローチのために私は詰められますか?これを変更すると、私のアーキテクチャが全面的に見直されます。誰も私にこの動的なコンテンツをGoogleクララーに拾わせる方法についていくつかの提案をお願いできますか? Googleが私のサイトをクロールし、websocketではなくgetリクエストで物事をレンダリングするタイミングを知る方法はありますか?

5
johhny B

この問題をもう少し詳しく理解してみましょう。

Googleは、他の検索エンジンと比較してJS/AJAXコンテンツのインデックス作成を比較的うまく行いますが、Googleがコンテンツを見る方法に影響を与える可能性があるため、実装にも依存します。

正直なところ、あなたのウェブサイトが検索エンジンでうまく機能するための長期的なビジョンを得たなら、あなたはあなたの実装についてもっと真剣に考えなければならないかもしれません。

確かなことは、AJAXコンテンツでさえクロールされる可能性があることです。他のサイトの方が構造が優れていることを考えると、ランク付けは非常に難しいかもしれません。

考慮すべきもう1つのポイントは、GoogleがAJAXコンテンツをうまく読み込めることがありますが、他の検索エンジンではうまくいかない可能性があることです。

それは古いビデオですが、あなたは見たいかもしれません:

https://www.youtube.com/watch?v=_6mtiwQ3nvw

動的コンテンツがどのようにページにロードされるかを少し詳しく説明して、インデックスに登録される可能性を確認する必要があります。

3
TopQnA