资源简介
适合爬虫初学者的必备入门demo,效果如下:
要求环境python3.7,安装库
requests,xlwt,re,os
采用新手友好的原始正则对文本进行筛选,爬取豆瓣top250电影信息,生成excel表格,可在pycharm中直接运行,
默认保存目录D:/test
代码片段和文件信息
import requests
import xlwt
import re
import os
#保存数据生成excel表格
def save_date(datalistsavepath):
if not os.path.exists(savepath):
print(‘未存在文件夹‘savepath‘创建中‘)
os.makedirs(savepath)
else:
print(‘已存在文件夹,保存中‘)
savepath=savepath+‘/豆瓣top250电影.xls‘
book=xlwt.Workbook(encoding=‘utf-8‘style_compression=0)
sheet=book.add_sheet(“豆瓣电影Top248“cell_overwrite_ok=True)
col=(‘排名‘‘名称‘‘详细信息‘‘评分‘‘介绍‘)
for i in range(05):
sheet.write(0icol[i])
for i in range(0len(datalist)):
sheet.write(i+10datalist[i].get(‘index‘))
sheet.write(i+1 1 datalist[i].get(‘title‘))
sheet.write(i+1 2 datalist[i].get(‘info‘))
sheet.write(i+1 3 datalist[i].get(‘score‘))
- 上一篇:漫画算法-小灰的算法之旅
- 下一篇:http服务端和socket服务端源码
相关资源
- 深度学习入门:基于Python的理论与实
- 《Python3爬虫、数据清洗与可视化》
- IDA.Pro.v7.2_Hgl-Green(Python)+7.0(x86ar
- python项目开发案例集锦
- 《Python开发实战》(PDF版高清扫描版
- opencv_python官方中文教程源码修改版
- Python学习手册(第3版)-带目录完整版
- python2.7:scipy-0.19.0-win64
- Python Cookbook 第3版 中文版.pdf
-
ba
semap-1.2.1-cp37-cp37m-win_amd64.whl - 《Python源码剖析-深度探索动态语言核
- MDNETpython实现
- Python + PyQt5 + MySQL模拟QQ的聊天与娱乐
- 《Python深度学习》2018中文
- opencv3计算机视觉 python实现
- python项目web
- 目标跟踪CSK算法python实现
- Pycharm+Django+Python+MySQL开发
- Python自动化运维技术与最佳实践
- Python学习手册.mobi kindle电子书 带源码
- OpenCV 3-python语言
- Python基础教程 Beginning Python From Novic
- Selenium2 Python自动化测试实战第二版高
- 《selenium2 python 自动化测试实战第二版
- opencv_python-3.4.0+contrib-cp36-cp36m-win_amd
- 机电控制python
- scipy-1.0.0-cp36-none-win_amd64.whl
- python2.7、numpy、matplotlib在windows 64位平
- 《Python深度学习》中文版pdf+英文版
- python3.6.5版本
评论
共有 条评论