可能性のある複製:
検索エンジンにサイトをクロールさせて、データのローカライズされたビューを表示するにはどうすればよいですか?
申し訳ありませんが、この投稿は少々不愉快になりましたが、これまでのところウェブ上で満足のいく答えは見つかりませんでした。
私はしばらくの間ウェブサイトを開発しており、その中に複数の言語のサポートを組み込みました。すべての用語、単語、フレーズはJSON形式のファイルに保存され、デコードされて配列に変換されます。これにより、サイト全体を異なる言語で簡単に作成できます。このWebサイトは100%自家製のコードで構成されています。Wordpress、Drupalなどのフレームワークはないため、前述の多言語プラグインはいずれも機能しません。
言語を切り替えるには、ユーザーはページの上部にあるリンクをクリックします(実際には、HTML構造の下部にある上部に配置されます)。サイトの各ページにはこのメニューがあり、クエリ文字列パラメーターが追加されます。 /hotels/index.html
は/hotels/index.html?lang=fr
になります。スクリプトはlang
パラメーターを確認し、ユーザーのCookieを変更して適切なJSONファイルをロードし、lang
パラメーターなしで以前と同じページに戻ります。これは、ユーザーが同じページにとどまり、リンクがまったく同じであるため、言語を切り替える非常に便利な方法です。 SEOが優先事項ではない複数の言語サポートを必要とする別のサイト(社内専用プログラム)の後にこの方法で構築しました。
訪問者が初めてサイトを訪れた場合、スクリプトはHTTP_ACCEPT_LANG
定数を見て、適切な言語をロードし、Cookieを設定します(ジオロケーティングの代わりに時間がかかり、個人的に嫌いです-私は住んでいます私のOSとブラウザは英語ですが、タイではGoogleでもタイ語版を提供しています)。
私の質問は-Googleや他のSEがこれらの言語でサイトのインデックスを作成することを望んでいますが、URLにlang
属性はありません。ユーザーがフランス語またはロシア語でGoogleを使用している場合、それぞれフランス語またはロシア語でサイトが提供されます。 URL /hotels/index.html
のバージョンは英語(デフォルト)、フランス語、ロシア語ですが、同じURLのままなので、これはGoogleや他のSEの問題だと思います。
Googleがこの方法で複数言語のサイトをインデックスに登録する方法を誰か説明できますか?サブドメインを使用すると、それらを分離するのに最適ですか?サイトでのURLの処理方法を変更したくないのは、インデックスに登録されるクエリ文字列をできる限り少なくしたいからです。
別の注意として、言語リンクを使用してインデックス作成のためにサイトを誤って開いたため、どういうわけかリダイレクトが正しく機能せず、Googleに/something/index.html?lang=ru?lang=ru
などのリンクが作成されました。スクリプトでこれらを検出し、これらのlang
パラメータを削除するために301リダイレクトを配置しました...これらの不良リンクは、GoogleのリダイレクトされたURLに徐々に置き換えられますか?
あなたの説明から私は言うだろう...あなたのサイトは決して複数の言語に最適化されたSEOではなく、この方向にそれを整えることは苦痛になるでしょう。
現在、このアプローチがあります: http://googlewebmastercentral.blogspot.com/2010/09/unifying-content-under-multilingual.html
基本的に、言語切り替えURLをGoogleにプッシュするために使用できます。しかし、これは実際のソリューションよりもSEOに最適化されていないサイトの修正以上のものです。
このため、独自に設計する前に、人気のあるフレームワークとCMSを確認することをお勧めします。これらは非常に一般的な問題であり、多くの異なる開発者によって何度も解決されています。 CMSを設計するために最初に座ったとき、それらのいくつかは明らかではないので、CMSを構築するときにそこにあるものを見て、いくつかの一般的な問題/解決策/慣習が何であるかを見るのに役立ちます。
まず、基本的なコンテンツは一意のURLからステートレスに提供されるべきです。ユーザーの言語設定をCookieまたはセッション変数で保存しても問題ありませんが、ユーザーを正しいURL /サブサイトにリダイレクトして、好みの言語でコンテンツを表示する必要があります。それ以外の場合、コンテンツは検索エンジンから効果的に隠蔽されます(悪意のある方法ではなく、自己害的な方法で)。
したがって、サイトで使用されている主要言語が何であれ、ページのそのバージョンは次のようになります。
http://foo/bar
ローカリゼーションは次のようになります。
http://ru.foo/bar
http://fr.foo/bar
http://de.foo/bar
etc.
Cookieを必要とせずに一意のURLから各ページにアクセスできる限り、必ずしもクリーンURLを使用する必要はありません。あなたはまだ次のようなことができます:
http://foo/bar?lang=ru
http://foo/bar?lang=fr
http://foo/bar?lang=de
ただし、クリーンURLはユーザーフレンドリであり、検索エンジンフレンドリでもあると一般に受け入れられています。
ほとんどの場合、コンテンツにカスタムルートを簡単に追加できるルーティングエンジンがあるため、この変更の実装は、従来のCMSまたはCMSフレームワークではかなり簡単です。そうしない場合、およびURLがアプリケーションアーキテクチャから切り離されていない場合は、さらに作業が必要になる場合があります。