WebクロールとWebスクレイピングの違いは何ですか？

Question

クロールとWebスクレイピングに違いはありますか？

違いがある場合、カスタマイズされた検索エンジンで後で使用するためにデータベースを提供するためにいくつかのWebデータを収集するために使用する最良の方法は何ですか？

Ben · Accepted Answer

クロールは基本的に、Google、Yahoo、MSNなどが行うことで、あらゆる情報を探します。スクレイピングは通常、特定のWebサイトを対象にしています。価格比較のため、まったく異なる方法でコーディングされています。

通常、スクレイパーは、スクレイピングが行われるはずのWebサイトに特注され、（良い）クローラーではできないことを行います。

David J. · Answer

はい、それらは異なります。実際には、両方を使用する必要がある場合があります。

（これまでのところ、他の答えは本質に達していないので、私は飛び込む必要があります。彼らは例を使用しますが、区別を明確にしません。確かに、それらは2010年からです！）

Webスクレイピングは、最小限の定義を使用して、Webドキュメントを処理し、そこから情報を抽出するプロセスです。 Webクロールを実行せずにWebスクレイピングを実行できます。

Webクロールは、最小限の定義を使用して、シードURLのリストから開始してWebリンクを繰り返し検索および取得するプロセスです。厳密に言えば、Webクロールを行うには、ある程度のWebスクレイピングを行う必要があります（URLを抽出するため）。

他の回答に記載されているいくつかの概念をクリアするには：

いくつかの参照：

Chris Harden · Answer

AFAIK Web CrawlingはGoogleが行うことです。リンクを調べ、そのサイトとリンク先のサイトのレイアウトのデータベースを構築するWebサイトを巡回します

Webスクレイピングは、Webページのプログラマティック分析であり、一部のデータをロードします。たとえば、BBC天気を読み込み、天気予報をリッピング（スクレイピング）して、他の場所に配置したり、別のプログラムで使用したりします。

Mohit Sharma · Answer

この投稿の詳細を説明します。良い要約はこの記事のこのチャートにあります：

shirk3y · Answer

Annie · Answer

これら2つには間違いなく違いがあります。 1つはサイトを訪問すること、もう1つは抽出することを指します。