web-dev-qa-db-ja.com

カスタム検索エンジンの結果が不十分です(Google検索API)

私には本当に大きな問題があります:

  • Googleカスタム検索エンジンCSEとREST AP​​Iを使用してURLを検索していますが、検索エンジンの結果の多くが欠落しています。

  • 私はこの事実についてインターネットで調べていますが、多くの人が同じ問題を抱えています。例えば

    https://stackoverflow.com/questions/34173457/why-google-web-search-api-custom-search-engine-and-page-search-results-are-diff

  • キーワード「site:」を使用してCSEでインデックス付けされているページ数を確認した場合、いくつかの結果が見つかりましたが、通常のWebブラウザーでは約93%の結果が見つかりました。

  • 「site:stackoverflow.com」のテストは次のとおりです。

    Web : 43 400 000 results
    CSE : 3 190 000
    

誰もが同じことを経験していますか?

2
Osmoze950

Googleのsite:検索結果の数は、非常に不正確な尺度です。見る:

一番下の行は、Googleの結果数の推定値を使用して、インデックス付けされたドキュメントの数を把握できることです。インデックスに含まれるドキュメントの数は、Googleが結果カウントで印刷する数と比較して、はるかに多いか、はるかに少ない場合があります。特定のサイトのインデックスに登録されたページの数をGoogleが推定するonly方法は、Google Search Consoleで確認済みのサイトの数を確認することです。

site:検索の検索結果にある特定のドキュメントを見つけたが、CSEに表示されない限り、問題はありません。

1