私のサイトのいくつかの問題により、www.example.com/page.html?task=view
を使用して多くのページが重複して表示されますが、その内容はwww.example.com/page.html
とまったく同じです。
1つの方法は、誰かが引数付きのページをフェッチするときにwww.example.com/page.html?task=view
からwww.example.com/page.html
へのhttp 301リダイレクトを使用することです。ただし、www.example.com/page.html?task=view
のようなリンクは、外の世界には引き続き表示されます。
別の方法は、Joomla CMSにタグを挿入するのが難しいため、使用したくない正規化です。
www.example.com/page.html?task=view
を外界から隠したい。
URLをwww.example.com/page.html?task=view
からwww.example.com/page.html
に変更することはできますか?私のWebページにwww.example.com/page.html?task=view
のhrefリンクがある場合、引数なしで外部の世界に見えるはずです。これは、301を使用して外部アクセスページwww.example.com/page.html?task=view
を.htaccessの引数を使用せずに変換することとは異なります。
URLの書き換えを使用できますが、クエリ文字列を使用する同じコンテンツのページが2つある場合、私の調査ではGoogleがペナルティを科さないことを示しています。 。
ただし、この「フォワーダー」を適切な場所に追加してコードで追加したい場合も検討します。
これは、.htaccess 301リダイレクトとURL書き換えの両方を使用することで可能になると思います。
特定のCGIパラメーターがなくてもアプリ/ CMSが機能する場合は、。htaccessまたはhttpd.confファイルのいずれかで、書き換えルールを使用してパラメーターを削除できます。
RewriteEngine On
RewriteCond %{QUERY_STRING} task=view
RewriteRule page.html %{REQUEST_URI}? [R=301,L]
Googlebotに対するページの可視性を意味する場合は、次のようなウェブマスターツールパネルを使用することをお勧めします。 http://support.google.com/webmasters/bin/answer.py?hl=ja&answer=1235687 =。 Googleが同じコンテンツのページをクロールしてインデックスに登録するのを防ぐために、サイトパラメータを設定する方法について説明します。
サイトにGoogle Webmaterツールをまだインストールしていない場合は、 https://www.google.com/webmasters/tools/ にインストールすることをお勧めします
他の検索エンジンボットからのページの不可視性に到達したい場合は、robots.txtファイルで次のようにいくつかの実験を試してください。
User-agent: *
Disallow: /*?task=view
これにより、ロボットがクロールする「?task = view」を含むすべてのURLがブロックされます。