资料来源:网络整理
时间:2023/2/14 1:14:32 共计:3608 浏览
最近用C#写一个简单的浏览器,通过WebBrowser获取的页面源码:
方法一:
System.IO.StreamReader getReader = new
System.IO.StreamReader(this.webBrowser.DocumentStream,
System.Text.Encoding.GetEncoding("gb2312"));
string gethtml = getReader.ReadToEnd();
注意:我这儿使用的不是DocumentText属性获取的页面内容。
方法二:
private void button1_Click(object sender, EventArgs e)
{
WebBrowser webBrowser = new WebBrowser();
webBrowser.DocumentCompleted += new
WebBrowserDocumentCompletedEventHandler(webBrowser_DocumentCompleted);
webBrowser.Navigate("http://www.mzwu.com/");
}
private void webBrowser_DocumentCompleted(object sender,
WebBrowserDocumentCompletedEventArgs e)
{
WebBrowser webBrowser = (WebBrowser)sender;
//WebBrowserReadyState.Interactive 和
WebBrowserReadyState.Complete
时都会触发DocumentCompleted
if (webBrowser.ReadyState == WebBrowserReadyState.Complete)
{
//webBrowser1.DocumentText 获取的内容中文会乱码
//获取文档编码
Encoding encoding =
Encoding.GetEncoding(webBrowser.Document.Encoding);
StreamReader stream = new StreamReader(webBrowser.DocumentStream,
encoding);
File.WriteAllText(@"C:\mzwu.txt", stream.ReadToEnd(),
Encoding.Unicode);
MessageBox.Show(DateTime.Now.ToString() + ":
页面内容获取完成! ");
}
}
版权说明:
本网站凡注明“广州京杭 原创”的皆为本站原创文章,如需转载请注明出处!
本网转载皆注明出处,遵循行业规范,如发现作品内容版权或其它问题的,请与我们联系处理!
欢迎扫描右侧微信二维码与我们联系。