web-dev-qa-db-ja.com

Google検索の「プライバシーバージョン」(つまり、Scroogle、StartingPage)がまったく同じ結果を返さないのはなぜですか?

Googleから検索結果を取得する「追跡しない」検索サイトが少なくとも2つあります。 (私はScroogle.orgとStartingPage.comを考えています)。 [注:StartingPage.comがどのように機能するか正確にはわかりません。 Scroogle.orgは、明らかにGoogle検索結果を「スクレイピング」します。 StartingPage.comは似たようなことをすると思います。]

ただし、StartingPage.comもScroogle.orgも、Google.comと同じexactlyを返さないことに気付きました。たとえば、「boingboing」を検索してみましたが、上位3つのヒットは3つのサービスすべてで同じでしたが、その後、ある程度の変動がありました。

StartingPage.comには「画像検索」もあり、これは最初はGoogleに似た赤面に見えます。ただし、StartingPageとGoogleの画像検索を使用すると、本質的に完全に異なる結果が得られます(通常のWebページ検索とは対照的に、少なくとも結果は多少似ていました)。

ですから、StartingPageとScroogleが検索結果のためにGoogleをスクレイピングしている場合、結果が同一ではないのはなぜですか?

編集(5-Feb-11):

StartingPageに関するその他の奇妙なデータ( http://www.boingboing.net/2011/02/04/startingpage-now-ret.html#comment-101829 から):

Javascript For Dummiesの本では、5th Waveコミックの1つに、自然言語プログラミングの専門家に紹介されている女性が示されています。彼女は、「はじめまして」と言っています。彼は「グロースプリッツ」と言います。

開始ページが単にプロキシとして機能し、情報をサイトからサイトに直接渡す場合、同じ結果が得られます。

開始ページ:Webの結果1-4のうちGlorsplitzの約4(0.03秒)Google:約1,310の結果(0.06秒)

別のセミランダム検索用語はどうですか?アニメ「あずまんが大王」の主人公は「ちお」という女の子です。

開始ページ:Webの結果1-10約2,530のchiochan(0.03秒)Google:約38,800の結果(0.09秒)

なぜ違いがありますか?

2
emacsomancer

それらの他のサイトの実装の技術的な詳細については知りません。ただし、アカウントやCookieの設定を使用して、通常の検索内容を把握していないサイトがある場合、さまざまな結果が期待できます。

Googleは長年にわたって検索結果をパーソナライズして、お客様のニーズに合わせた情報を提供しています。最近、Googleの検索結果はより明確になり、友人ネットワークの仕事で共有したものに基づいて検索結果が表示されます。また、Googleプレイスで評価やレビューを確認します。たとえば、評価や友人の評価が結果を変更し、よりパーソナライズされた情報を提供します。

1
Joel H