资源简介
可以设置的ip数量爬取
运行前需要安装 bs4模块 以及 requests模块
下载地址分别为:
https://pypi.python.org/packages/10/ed/7e8b97591f6f456174139ec089c769f89a94a1a4025fe967691de971f314/bs4-0.0.1.tar.gz
https://pypi.python.org/packages/16/09/37b69de7c924d318e51ece1c4ceb679bf93be9d05973bb30c35babd596e2/requests-2.13.0.tar.gz#md5=921ec6b48f2ddafc8bb6160957baf444
下载后安装方法如下(以bs4模块为例):
1.解压bs4-0.0.1.tar.gz文件后,并 在命令行 cd到该目录,输入命令: python setup.py install
2. 回车运行,安装完毕
代码片段和文件信息
import re
from random import choice
import requests
import bs4
url = “http://www.xicidaili.com/“
headers = { “Accept“:“text/htmlapplication/xhtml+xmlapplication/xml;“
“Accept-Encoding“:“gzip“
“Accept-Language“:“zh-CNzh;q=0.8“
“Referer“:“http://www.xicidaili.com/“
“User-Agent“:“Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/42.0.2311.90 Safari/537.36“
}
r = requests.get(urlheaders=headers)
soup = bs4.BeautifulSoup(
- 上一篇:python3爬虫采集淘宝商品数据
- 下一篇:python 爬虫(pyspider)
相关资源
- 《Python3爬虫、数据清洗与可视化》
- python2.7:scipy-0.19.0-win64
- Python基础教程 Beginning Python From Novic
- scipy-1.0.0-cp36-none-win_amd64.whl
- F3arWIN_256.zip
- eclipse中的python插件
- python环境离线快速安装带pip
- python脚本运行环境.zip
- Python编程:从入门到精通配套资源.
- 旅行模拟查询系统 96分 [BUPT]数据结构
- 猫狗分类自写.zip
- ntx64_odbc_cli.zip
- 上海行政区、人口和道路的gis数据.
- 完整书签PySpark实战指南:利用Python和
- VRP、WRSN问题求解.zip
- PyDev 7.4.0.zip
- Python Microservices Development(pdf+epub+mo
- Learning Python(pdf+epub+mobi+code_files).
- scipy-1.5.4-cp37-cp37m-win_amd64.whl
- scipy-1.4.1-cp35-cp35m-win_amd64.whl
- en_core_web_sm-2.2.0.tar.zip
- 卷积神经网络的Python实现-参考代码
- PyDev 5.2.0
- web2py_win_py37.zip
- SELENIUM2自动化测试实战基于PYTHON语言
- ffmpeg-win32-v3.2.4exe.zip
- keras之父之作《Python深度学习》2018中
- face.dat.zip
- Python数据可视化.pdf.zip
- OpenCV3计算机视觉Python语言实现(第二
评论
共有 条评论