• 大小: 0.57M
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-03-28
  • 语言: 其他
  • 标签: 其他  

资源简介

利用HtmlAgilityPack可以轻松获取网页内容,但是无法获取动态加载的内容, 通过webBrowser模拟浏览器,获取网页内容。 大致思路:

1、webBrowser加载网页 (如有Ajax动态加载分页的网站,需要配合页面动作,直到页面加载完成,如:滚动条操作) 

2、加载完成后获取webBrowser.Document (配合使用webBrowser_DocumentCompleted和Application.DoEvents()) 3、解析网页内容

资源截图

代码片段和文件信息

using System;
using System.Windows.Forms;
using System.Net;
using System.Text.Regularexpressions;

namespace InternetSpiderMan
{
    static  class  Classbase
    {
        #region   public bool OutExcel() 导出数据到Execl
        /// 
        /// 导出数据到Execl
        /// 

        /// 
        /// 
        public static bool OutExcel(DataGridView paramdatagridview)
        {
            try
            {

                if (paramdatagridview.Rows.Count.Equals(0))
                {
                    return false;
                }
                Microsoft.Office.Interop.Excel.Application myExcel = new Microsoft.Office.Interop.Excel.Application();
                myExcel.Application.Workbooks.Add(true);
                myExcel.Visible = true;


                for (int i = 0; i < paramdatagridview.ColumnCount; i++)
                {
                    ////隐藏列跳过
                    //

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件     134144  2012-08-06 21:30  bin\Debug\DLL\HtmlAgilityPack.dll

     文件    1100392  2007-10-10 09:48  bin\Debug\DLL\Microsoft.Office.Interop.Excel.dll

     文件     134144  2012-08-06 21:30  bin\Debug\HtmlAgilityPack.dll

     文件      28672  2016-02-01 11:25  bin\Debug\InternetSpiderMan.exe

     文件        161  2016-01-29 11:44  bin\Debug\InternetSpiderMan.exe.config

     文件      34304  2016-02-01 11:25  bin\Debug\InternetSpiderMan.pdb

     文件      22688  2016-02-01 11:23  bin\Debug\InternetSpiderMan.vshost.exe

     文件     134144  2012-08-06 21:30  DLL\HtmlAgilityPack.dll

     文件    1100392  2007-10-10 09:48  DLL\Microsoft.Office.Interop.Excel.dll

     文件       1211  2016-02-01 11:25  obj\Debug\InternetSpiderMan.csproj.FileListAbsolute.txt

     文件       1077  2016-02-01 11:25  obj\Debug\InternetSpiderMan.csproj.GenerateResource.Cache

     文件      28672  2016-02-01 11:25  obj\Debug\InternetSpiderMan.exe

     文件       4852  2016-02-01 11:25  obj\Debug\InternetSpiderMan.FormMain.resources

     文件        180  2016-02-01 11:25  obj\Debug\InternetSpiderMan.Form_sqw.resources

     文件      34304  2016-02-01 11:25  obj\Debug\InternetSpiderMan.pdb

     文件        180  2016-02-01 11:25  obj\Debug\InternetSpiderMan.Properties.Resources.resources

     文件       1386  2015-02-05 15:17  Properties\AssemblyInfo.cs

     文件       2874  2016-01-29 11:44  Properties\Resources.Designer.cs

     文件       5612  2015-02-05 15:17  Properties\Resources.resx

     文件       1117  2016-01-29 11:44  Properties\Settings.Designer.cs

     文件        249  2015-02-05 15:17  Properties\Settings.settings

     文件        161  2016-01-29 11:44  app.config

     文件       5098  2016-01-28 14:49  Classbase.cs

     文件       7939  2016-02-01 11:03  Form_sqw.cs

     文件      15398  2016-02-01 11:03  Form_sqw.Designer.cs

     文件       6944  2016-02-01 11:03  Form_sqw.resx

     文件        692  2016-02-01 11:23  FormMain.cs

     文件       3352  2016-02-01 11:04  FormMain.Designer.cs

     文件      12549  2016-02-01 11:04  FormMain.resx

     文件     290304  2012-08-06 21:30  HtmlAgilityPack.pdb

............此处省略14个文件信息

评论

共有 条评论