web-dev-qa-db-ja.com

不要なパラメーターを含むGoogle結果リストのリンク

。htaccessを使用してパラメーター化されたURLをフォルダーパターンベースのURLに変換するWebサイトがあります

例えば ​​:

www.example.com?lang=de&cat=mycategory 

になる

www.example.com/de/mycategory

Googleはこのページを

www.example.com/de/category?lang=de&cat=mycategory

結果リストにあり、その理由はわかりません。ウェブサイトのソースコードを確認しますが、リンクwww.example.com/de/category?lang=de&cat=mycategoryがソースコードに含まれていないため、Googleがこの種のリンクを作成する理由がわかりません。

。htaccessファイルの書き換えルールは次のようになります。

RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule ^de/mycategory /index.php?lang=de&cat=mycategory [NC,L]
2
zersaegen

問題の原因はhtmlまたはjavascriptである可能性があり、他の人がネット上に置くリンクを制御することはできません。そして、彼はそれをリクエストするときにページを見つけるので、インデックスを付けます。コードで答えを出すためのいくつかの情報を見逃します(CMSを使用しますか?.htaccessのその他の規則など)。

  1. .htaccessに永続的なリダイレクトを記述してクエリ文字列を削除しますが、リダイレクトループに注意してください(/ de/mycat-> /index.php?lang=de&cat=mycat-> index.php)

  2. 通常、この種の状況はCMSによって管理されます。ディスク上に存在する静的ファイルではないものはすべて、index.phpファイルに移動し、urlの正確性をチェックし、必要に応じてリダイレクトを送信します。

  3. また、 Google Webmaster Tools にアクセスして、クロールの統計情報が表示される場所を確認してください。 URLのどのパラメーターを実行するかを伝えることができるページがあります。

  4. robots.txt ファイルを使用して、Google /他のボットが一部のファイルをクロールおよびインデックス登録できないようにします。

2
Zimmi