资源简介
可以爬取完整的豆瓣影评,不需登录
代码片段和文件信息
import requestsretime
def get_html(sessiontarget):
response = session.get(targetheaders = head)
response.encoding = “utf-8“
return response.text
def get_data(html):
comment = re.findall(comment_patternhtml) #提取评论
next_page = re.findall(next_patternhtml) #获取下一页
return commentnext_page
def sort_data(infof):
f = open(‘F:/douban.txt‘‘a+‘encoding = ‘utf-8‘)
comment = info[0]
for n in range(len(comment)):
f.write(comment[n].strip() + ‘\n\n‘)
f.close()
def main():
session = requests.Session()
f = open(‘F:/douban.txt‘‘a+‘encoding = ‘utf-8‘)
target = first_url
i = 0
while True:
html = get_html(sessiontarget)
info = get_data(html)
#p
- 上一篇:《疯狂Python讲义》源代码
- 下一篇:python自学笔记(md文档)
相关资源
- Django2 文件上传及功能支持中文名文件
- 深度学习入门:基于Python的理论与实
- 《Python3爬虫、数据清洗与可视化》
- IDA.Pro.v7.2_Hgl-Green(Python)+7.0(x86ar
- python项目开发案例集锦
- 《Python开发实战》(PDF版高清扫描版
- opencv_python官方中文教程源码修改版
- Python学习手册(第3版)-带目录完整版
- python2.7:scipy-0.19.0-win64
- Python Cookbook 第3版 中文版.pdf
-
ba
semap-1.2.1-cp37-cp37m-win_amd64.whl - 《Python源码剖析-深度探索动态语言核
- MDNETpython实现
- Python + PyQt5 + MySQL模拟QQ的聊天与娱乐
- 《Python深度学习》2018中文
- opencv3计算机视觉 python实现
- python项目web
- 目标跟踪CSK算法python实现
- Pycharm+Django+Python+MySQL开发
- Python自动化运维技术与最佳实践
- Python学习手册.mobi kindle电子书 带源码
- OpenCV 3-python语言
- Python基础教程 Beginning Python From Novic
- Selenium2 Python自动化测试实战第二版高
- 《selenium2 python 自动化测试实战第二版
- opencv_python-3.4.0+contrib-cp36-cp36m-win_amd
- 机电控制python
- scipy-1.0.0-cp36-none-win_amd64.whl
- python2.7、numpy、matplotlib在windows 64位平
- 《Python深度学习》中文版pdf+英文版
评论
共有 条评论