资源简介
利用HtmlAgilityPack可以轻松获取网页内容,但是无法获取动态加载的内容, 通过webBrowser模拟浏览器,获取网页内容。 大致思路:
1、webBrowser加载网页 (如有Ajax动态加载分页的网站,需要配合页面动作,直到页面加载完成,如:滚动条操作)
2、加载完成后获取webBrowser.Document (配合使用webBrowser_DocumentCompleted和Application.DoEvents()) 3、解析网页内容
代码片段和文件信息
using System;
using System.Windows.Forms;
using System.Net;
using System.Text.Regularexpressions;
namespace InternetSpiderMan
{
static class Classbase
{
#region public bool OutExcel() 导出数据到Execl
///
/// 导出数据到Execl
///
///
///
public static bool OutExcel(DataGridView paramdatagridview)
{
try
{
if (paramdatagridview.Rows.Count.Equals(0))
{
return false;
}
Microsoft.Office.Interop.Excel.Application myExcel = new Microsoft.Office.Interop.Excel.Application();
myExcel.Application.Workbooks.Add(true);
myExcel.Visible = true;
for (int i = 0; i < paramdatagridview.ColumnCount; i++)
{
////隐藏列跳过
//
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 134144 2012-08-06 21:30 bin\Debug\DLL\HtmlAgilityPack.dll
文件 1100392 2007-10-10 09:48 bin\Debug\DLL\Microsoft.Office.Interop.Excel.dll
文件 134144 2012-08-06 21:30 bin\Debug\HtmlAgilityPack.dll
文件 28672 2016-02-01 11:25 bin\Debug\InternetSpiderMan.exe
文件 161 2016-01-29 11:44 bin\Debug\InternetSpiderMan.exe.config
文件 34304 2016-02-01 11:25 bin\Debug\InternetSpiderMan.pdb
文件 22688 2016-02-01 11:23 bin\Debug\InternetSpiderMan.vshost.exe
文件 134144 2012-08-06 21:30 DLL\HtmlAgilityPack.dll
文件 1100392 2007-10-10 09:48 DLL\Microsoft.Office.Interop.Excel.dll
文件 1211 2016-02-01 11:25 obj\Debug\InternetSpiderMan.csproj.FileListAbsolute.txt
文件 1077 2016-02-01 11:25 obj\Debug\InternetSpiderMan.csproj.GenerateResource.Cache
文件 28672 2016-02-01 11:25 obj\Debug\InternetSpiderMan.exe
文件 4852 2016-02-01 11:25 obj\Debug\InternetSpiderMan.FormMain.resources
文件 180 2016-02-01 11:25 obj\Debug\InternetSpiderMan.Form_sqw.resources
文件 34304 2016-02-01 11:25 obj\Debug\InternetSpiderMan.pdb
文件 180 2016-02-01 11:25 obj\Debug\InternetSpiderMan.Properties.Resources.resources
文件 1386 2015-02-05 15:17 Properties\AssemblyInfo.cs
文件 2874 2016-01-29 11:44 Properties\Resources.Designer.cs
文件 5612 2015-02-05 15:17 Properties\Resources.resx
文件 1117 2016-01-29 11:44 Properties\Settings.Designer.cs
文件 249 2015-02-05 15:17 Properties\Settings.settings
文件 161 2016-01-29 11:44 app.config
文件 5098 2016-01-28 14:49 Classba
文件 7939 2016-02-01 11:03 Form_sqw.cs
文件 15398 2016-02-01 11:03 Form_sqw.Designer.cs
文件 6944 2016-02-01 11:03 Form_sqw.resx
文件 692 2016-02-01 11:23 FormMain.cs
文件 3352 2016-02-01 11:04 FormMain.Designer.cs
文件 12549 2016-02-01 11:04 FormMain.resx
文件 290304 2012-08-06 21:30 HtmlAgilityPack.pdb
............此处省略14个文件信息
- 上一篇:基于RS232通讯的电池管理系统源码
- 下一篇:电动汽车动力电池组管理系统设计
相关资源
- (4)LCD显示(1).rar
- ProgrammingGameAIByExample.pdf
- SMBMS.rar
- 断刃小组批量getshell工具.zip
- 12467230STM32L073xx_User_Manual.chm
- OAuth2实战.pdf
- 电分期末.zip
- 胡伟武_计算机体系结构课件_2017.zip
- ComputerArchitectureAQuantitativeApproach5th.p
- Classificationoftime-seriesimagesusingdeepcnn.
- 微擎小程序榆落微时光1.0.23小程序前
- S7-1200仿真教程.pdf
- 6908d19c7e04dbde289b4dec5403d7fb.rar
- 泛函分析:理论和应用.pdf
- _源代码.rar
- sogoupinyin-2.2.0.0102-2.zip
- 模式分析的核方法中文版和英文版合
- zw_qq_41143492-10381309-学生考试系统.zip
- zw_feifan50-9720417-MissionPlanner1.3.32PlayUA
- zw_weixin_42810059-10567648-数学分析考研笔
- 刺客.rar
- zw_DXF转G代码.zip
- 彩票开发源码.zip
- 斯坦福-IntroductiontoRobotics.zip
- zw_gephi-0.8.2-beta.setup.zip
- zw_嵌入式网络那些事(完整中文版)
- zw_WINDOWSAPI程序设计参考大全.zip
- zw_ssm-crm-new.zip
- zw_SolidWorks2014中文版基础教程.zip
- zw_Altera官方元件封装库.zip
评论
共有 条评论