资源简介
强化版:C#网络爬虫,新加了许多功能,图片爬取,下载,网址爬取下载等等,更多功能,待各位朋友去改进咯!!!
代码片段和文件信息
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Runtime.Remoting.Messaging;
using System.Text;
using System.Threading;
using System.Threading.Tasks;
using System.Windows.Forms;
namespace 网络爬虫
{
public partial class FrmDemoGo : Form
{
public FrmDemoGo()
{
InitializeComponent();
}
//等待采集链接的队列
private List NconnUrls = new List();
//等待采集的图片链接的下载队列
private List LoadingUrls = new List();
///
/// 已采集过图片的链接
///
private List UsedUrls = new List();
//已采集过链接的链接
private List UsedConnUrls = new List();
//已使用过的图片
private List UsedImgUrls = new List();
private readonly int _maxtask = 200;
private int _downingPicCount = 0;
private int _downLoadPicCount = 0;
private int _startDownPicCount = 0;
//线程
Thread Tstarting = null;
private void FrmDemoGo_Load(object sender EventArgs e)
{
CheckForIllegalCrossThreadCalls = false;
Tstarting = new Thread(DownLoading);
}
List urlList = new List();
private void btn_paconggo_Click(object sender EventArgs e)
{
Chioce_floder();
//初始链接加入等待采集的图片链接的下载队列
LoadingUrls.Add(txt_Url.Text);
//初始链接加入等待采集链接的队列
NconnUrls.Add(txt_Url.Text);
string url = HttpHelper.HtmlCodeRequest(this.txt_Url.Text.Trim());
txt_HttpResult.Text = url;
Global.WebUrl = StringHelper.GetPureUrl(txt_Url.Text);
//计时器开始
Tstarting.Start();
btn_paconggo.Enabled = false;
}
//图片文件存放地址
private void Chioce_floder()
{
fbd_url.ShowDialog();
string path = fbd_url.SelectedPath;
if (!string.IsNullOrEmpty(path))
{
Global.FloderUrl = fbd_url.SelectedPath + “\\“;
}
else
{
Global.FloderUrl = Application.StartupPath + Global.FloderMoUrl;
}
}
///
/// 下载成功
///
///
private void onDownLoadFinish(IAsyncResult asyncresult)
{
AsyncResult result = (AsyncResult)asyncresult;
StopTimeHandler del = (StopTimeHandler)result.AsyncDelegate;
string data = (string)result.AsyncState;
string name = del.EndInvoke(result);
TextPicChange(name + data);
_downLoadPicCount++;
_downingPicCount--;
TipDownLoad();
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 16958 2016-09-10 20:16 网络爬虫\网络爬虫\11.ico
文件 187 2016-09-10 15:23 网络爬虫\网络爬虫\App.config
文件 50176 2016-09-10 20:19 网络爬虫\网络爬虫\bin\Debug\网络爬虫.exe
文件 187 2016-09-10 15:23 网络爬虫\网络爬虫\bin\Debug\网络爬虫.exe.config
文件 42496 2016-09-10 20:19 网络爬虫\网络爬虫\bin\Debug\网络爬虫.pdb
文件 24224 2016-09-10 20:16 网络爬虫\网络爬虫\bin\Debug\网络爬虫.vshost.exe
文件 187 2016-09-10 15:23 网络爬虫\网络爬虫\bin\Debug\网络爬虫.vshost.exe.config
文件 8156 2016-09-10 20:19 网络爬虫\网络爬虫\FrmDemoGo.cs
文件 11359 2016-09-10 20:16 网络爬虫\网络爬虫\FrmDemoGo.Designer.cs
文件 20812 2016-09-10 20:16 网络爬虫\网络爬虫\FrmDemoGo.resx
文件 572 2016-09-10 16:52 网络爬虫\网络爬虫\Global.cs
文件 12674 2016-09-10 19:25 网络爬虫\网络爬虫\HttpHelper.cs
文件 865 2016-09-10 15:23 网络爬虫\网络爬虫\obj\Debug\DesignTimeResolveAssemblyReferences.cache
文件 7231 2016-09-10 20:16 网络爬虫\网络爬虫\obj\Debug\DesignTimeResolveAssemblyReferencesInput.cache
文件 0 2016-09-10 15:23 网络爬虫\网络爬虫\obj\Debug\TemporaryGeneratedFile_036C0B5B-1481-4323-8D20-8F5ADCB23D92.cs
文件 0 2016-09-10 15:23 网络爬虫\网络爬虫\obj\Debug\TemporaryGeneratedFile_5937a670-0e60-4077-877b-f7221da3dda1.cs
文件 0 2016-09-10 15:23 网络爬虫\网络爬虫\obj\Debug\TemporaryGeneratedFile_E7A71F73-0F8D-4B9B-B56E-8E70B10BC5D3.cs
文件 1108 2016-09-10 20:19 网络爬虫\网络爬虫\obj\Debug\网络爬虫.csproj.FileListAbsolute.txt
文件 981 2016-09-10 20:19 网络爬虫\网络爬虫\obj\Debug\网络爬虫.csproj.GenerateResource.Cache
文件 2211 2016-09-10 20:19 网络爬虫\网络爬虫\obj\Debug\网络爬虫.csprojResolveAssemblyReference.cache
文件 50176 2016-09-10 20:19 网络爬虫\网络爬虫\obj\Debug\网络爬虫.exe
文件 10228 2016-09-10 20:19 网络爬虫\网络爬虫\obj\Debug\网络爬虫.FrmDemoGo.resources
文件 42496 2016-09-10 20:19 网络爬虫\网络爬虫\obj\Debug\网络爬虫.pdb
文件 180 2016-09-10 20:19 网络爬虫\网络爬虫\obj\Debug\网络爬虫.Properties.Resources.resources
文件 528 2016-09-10 15:30 网络爬虫\网络爬虫\Program.cs
文件 1366 2016-09-10 15:23 网络爬虫\网络爬虫\Properties\AssemblyInfo.cs
文件 2876 2016-09-10 15:23 网络爬虫\网络爬虫\Properties\Resources.Designer.cs
文件 5612 2016-09-10 15:23 网络爬虫\网络爬虫\Properties\Resources.resx
文件 1099 2016-09-10 15:23 网络爬虫\网络爬虫\Properties\Settings.Designer.cs
文件 249 2016-09-10 15:23 网络爬虫\网络爬虫\Properties\Settings.settings
............此处省略16个文件信息
- 上一篇:C#开发网络爬虫
- 下一篇:C#模拟电梯控制源码
评论
共有 条评论