资源简介
代码片段和文件信息
using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Linq;
using System.Text;
using System.Text.Regularexpressions;
using System.Threading;
using System.Threading.Tasks;
using Wesley.Crawler.SimpleCrawler.Models;
namespace Wesley.Crawler.SimpleCrawler
{
internal class Ctrip
{
private static void Main(string[] args)
{
Stopwatch sw = new Stopwatch();
sw.Start();
var cityUrl = “http://hotels.ctrip.com/citylist“; //定义爬虫入口URL
string cityHtml = HtmlTag.GetHtml(cityUrl Encoding.UTF8);
var cityList = new List(); //定义泛型列表存放城市名称及对应的酒店URL
//使用正则表达式清洗网页源代码中的数据
var links = Regex.Matches(cityHtml
@“]+href=““*(
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2017-05-22 14:48 Simple-Web-Crawler-master\
文件 2518 2016-07-08 13:12 Simple-Web-Crawler-master\.gitattributes
文件 3833 2016-07-08 13:12 Simple-Web-Crawler-master\.gitignore
目录 0 2017-05-22 14:48 Simple-Web-Crawler-master\.vs\
目录 0 2017-05-22 14:48 Simple-Web-Crawler-master\.vs\SimpleCrawler\
目录 0 2017-05-22 14:48 Simple-Web-Crawler-master\.vs\SimpleCrawler\v14\
文件 70656 2017-05-24 10:08 Simple-Web-Crawler-master\.vs\SimpleCrawler\v14\.suo
文件 3256 2016-07-08 13:12 Simple-Web-Crawler-master\README.md
文件 1029 2016-07-08 13:12 Simple-Web-Crawler-master\SimpleCrawler.sln
目录 0 2017-05-24 10:08 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\
文件 1612 2017-05-23 15:24 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\App.config
文件 2223 2017-05-24 10:08 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Ctrip.cs
文件 18375 2017-05-23 15:22 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\DbHelperOra.cs
目录 0 2017-05-22 14:47 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Events\
文件 840 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Events\OnCompletedEventArgs.cs
文件 445 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Events\on
文件 425 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Events\on
文件 16209 2017-05-23 10:05 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\HtmlTag.cs
文件 23796 2017-05-23 10:00 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\HttpRequestUtility.cs
文件 547 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\ICrawler.cs
目录 0 2017-05-22 14:47 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Images\
文件 466822 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Images\1.携程网城市列表.png
文件 59213 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Images\2.抓取网页源代码.png
文件 58956 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Images\3.使用正则清洗数据.png
文件 70128 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Images\4.抓取城市下的酒店列表.png
文件 37250 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Images\5.并发抓取示例.png
目录 0 2017-05-22 14:47 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Models\
文件 287 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Models\City.cs
文件 335 2016-07-08 13:12 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Models\Hotel.cs
文件 10361 2017-05-23 17:26 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Program.cs
目录 0 2017-05-22 14:47 Simple-Web-Crawler-master\Wesley.Crawler.SimpleCrawler\Properties\
............此处省略24个文件信息
- 上一篇:C# 拼图游戏
- 下一篇:asp.net 拖拽上传文件
相关资源
- 自写C#蜘蛛爬虫源代码
- ~爬虫蜘蛛C#版~
- 使用C#实现爬虫
- 一个开源的C#蜘蛛爬虫程序,看了让你
- 2018年京东评论数据集
- C#语言的网络爬虫
- C# 爬虫接口
- C#网络爬虫强化版
- C#开发网络爬虫
- C#网络爬虫
- C#蜘蛛爬虫源代码多线程
- C# 网络爬虫程序源码 C#网络舆论监控
- C# 网页抓取网络爬虫的新闻弹窗小工
- 爬虫 去哪儿旅游数据集
- C#网络爬虫源码.zip
- 东方财富股吧评论语料
- C#网络编程全面教程(c#爬虫)
- C#超级网络爬虫DEMO
- C#网络爬虫程序源码
- 采集网页最简单的代码很好用的..
- Crawler爬虫(采集京东商品信息)
- c#爬虫:爬网页图片直接到桌面文件夹
- C#网络爬虫抓取图片
- C# 网络爬虫
- 百度网盘爬虫 采集百度网盘资源
- C# 网络爬虫自动图片
- C# 网络爬虫源码
- NCrawler网络爬虫开源代码
- C#网络爬虫工具(亲测可用)
- C#爬虫研究,拼多多商家自动发货系统
评论
共有 条评论