资源简介
用python语言写的一个网络爬虫程序,实现了爬取网站内的所有链接,可以用来对一个网站的受欢迎程度进行数据分析
代码片段和文件信息
# encoding utf-8
# Function:acquire the link on the web page
import urllib.request
import re
r = re.compile(r‘href=“(http://www\.cnpythoner\.com.+?)“‘)#正则
def get_urls_and_save_from_contents(url): #打开当前页面,筛选符合条件的网址
try:
req = urllib.request.Request(url)
req.add_header(‘User-Agent‘‘Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML like Gecko) Chrome/46.0.2486.0 Safari/537.36 Edge/13.10586‘)
response = urllib.request.urlopen(req)
contents = response.read().decode(‘utf-8‘)
g = []
相关资源
- python实现SGBM图像匹配算法
- python实现灰度直方图均衡化
- scrapy_qunar_one
- Python学习全系列教程永久可用
- python简明教程.chm
- 抽奖大转盘python的图形化界面
- 双边滤波器实验报告及代码python
- python +MYSQL+HTML实现21蛋糕网上商城
- Python-直播答题助手自动检测出题搜索
- OpenCV入门教程+OpenCV官方教程中文版
- Python 串口工具源码+.exe文件
- Python开发的全栈股票系统.zip
- Python操作Excel表格并将其中部分数据写
- python书籍 PDF
- 利用python绘制散点图
- python+labview+No1.vi
- 老男孩python项目实战
- python源码制作whl文件.rar
- python3.5可用的scipy
- PYTHON3 经典50案例.pptx
- 计算机科学导论-python.pdf
- python模拟鼠标点击屏幕
- windows鼠标自动点击py脚本
- 鱼c小甲鱼零基础学python全套课后题和
- Python 练习题100道
- Practical Programming 2nd Edition
- wxPython Application Development Cookbook
- python 3.6
- Python 3.5.2 中文文档 互联网唯一CHM版本
- python3.5.2.chm官方文档
评论
共有 条评论