私は正常に動作するWebページを取得するために以下を使用しています
public static HtmlDocument GetWebPageFromUrl(string url)
{
var hw = new HtmlWeb();
return hw.Load(url);
}
しかし、HTMLのコンテンツ全体をHtmlDocumentから文字列に吐き出すにはどうすればよいですか?
HtmlDocument.ToString()を試しましたが、ドキュメント内のすべてのHTMLが表示されませんか?何か案は?
DocumentNode.OuterHtml
には完全なhtmlが含まれています:
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.Load("sample.html");
string html = doc.DocumentNode.OuterHtml;
あなたの例では:
public static string GetWebPageHtmlFromUrl(string url)
{
var hw = new HtmlWeb();
HtmlDocument doc = hw.Load(url);
return doc.DocumentNode.OuterHtml;
}