私のeコマースアプリケーションでは、顧客が検索ボックスから行ったすべての検索を保存します。私は先月かそこらで気づきましたが、統計の主要な検索用語は、フィールドに事前に入力されている用語です-たとえば-「ここで検索」。 JavaScriptを有効にしている場合、この用語をユーザーとして送信することはできませんが、そのようなことが頻繁に発生しているという事実から、Googleのようなボットがこの検索ボックスを自動送信していると信じ込ませています。これは可能ですか?
Googleによれば、GooglebotはGETフォームを送信する場合があります。
http://googlewebmastercentral.blogspot.com/2008/04/crawling-through-html-forms.html
具体的には、高品質のサイトで要素に遭遇した場合、フォームを使用して少数のクエリを実行することを選択できます。テキストボックスの場合、コンピューターはフォームのあるサイトから自動的に単語を選択します。フォームの選択メニュー、チェックボックス、ラジオボタンについては、HTMLの値の中から選択します。各入力の値を選択したら、ユーザーが作成した可能性のあるクエリに対応するURLを生成してからクロールします。
Googleのような評判の良い会社のボットよりも、おそらく不正なスパムボットである可能性が非常に高いと思います。
ユーザーがそのようなクエリを入力したときに、単にIPとユーザーエージェントを記録するのはどうですか?
これは私のサイトで起こっており、ユーザーが数量などの代替テキストボックスのキーボードでエンターキーを押すと検索が起動したことが判明したためです。ボットの可能性もありますが、このシナリオの方が可能性が高いと思います。
テストするには、検索ボックス以外の代替フィールドでEnterキーを押してみてください。
これは完全に定量化されていませんが、いくつかのサイトの検索結果ページがGoogleのインデックスにかなり曖昧に表示されている場合があります。
これは、ランダムな文字列を挿入することが原因である可能性がありますが、これらのURLは、Googleツールバー、またはサイト検索URLパターンを理解するように設定したアナリティクスから取得されたものと思われます。
ユーザーはほとんどのサイトの検索機能をChrome内で直接使用できます。
Chromeで、サイトのドメインを入力してからTabキーを押すと、検索テキストを入力するよう求められます。この検索では、Googleがサイトの検索フォームであると想定しているものを使用します。これはおそらくあなたが経験している問題だと思います。
皮肉なことに、私自身も同様の問題を抱えています。サイトには、「サイト検索」フォームではなく、Chromeが使用している「ディーラー検索」フォームがあります。