これは、スクレイピング時にWebページを取得するbestの方法ですか?
_HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse();
var doc = new HtmlAgilityPack.HtmlDocument();
doc.Load(resp.GetResponseStream());
var element = doc.GetElementbyId("//start-left");
var element2 = doc.DocumentNode.SelectSingleNode("//body");
string html = doc.DocumentNode.OuterHtml;
_
Webページを取得するHtmlWeb().Load
を見てきました。それはロードしてウェブページをスクレイプするより良い選択肢ですか?
OK、代わりに試してみます。
_HtmlDocument doc = web.Load(url);
_
今、私のdoc
を手に入れたのに、あまりプロパティを取得しませんでした。 SelectSingleNode
のような人はいません。使用できるのはGetElementById
のみで、これは機能しますが、クラスを取得したいです。
このようにする必要がありますか?
_var htmlBody = doc.DocumentNode.SelectSingleNode("//body");
htmlBody.SelectSingleNode("//paging");
_
HtmlWebの使用がはるかに簡単になりました。
string Url = "http://something";
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(Url);