资源简介
实现python爬取小说
代码片段和文件信息
# -*- coding:utf-8 -*-
import re
import requests
url = “http://mianzhuan.wddsnxn.org“
headers = {‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 \
(KABUL like Gecko) Chrome/14.0.835.163 Safari/535.1‘}
params = {‘tickers‘: ‘MST‘ ‘date‘: ‘2020-07-15‘}
response = requests.get(urlheaders=headersparams=params)
response.encoding=‘utf-8‘
html = response.text
#print(html)
#获取小说的标题
title = re.findall(r‘ (.*?) ‘html)
#print(title)
url = re.findall(r‘ .*? ‘html)
#print(url)
#新建文件
fb = open(“note.txt“‘w‘encoding=‘utf-8-sig‘)
#for循环迭代 下载每一个章节
i = 0
for info in url:
info_response = requests.get(infoheaders=headersparams=params)
info_response.encoding = ‘utf-8-sig‘
info_html = info_response.text
#info_html
#提取章节内容
content = re.findall(r‘(.*?)ript language=“javascript“.*?>‘info_html)
#print(content)
#清洗数据
content=content[0].replace(“
““\n“)
content = content.replace(“
“““)
#
相关资源
- 彼岸花网壁纸爬虫
- Python 爬虫小说.ipynb
- 爬虫爬取网易云音乐
- 北邮python爬虫学堂在线
- python简单爬虫
- 爬取58同城二手房信息.py
- 知网爬虫软件(python)
- python爬虫爬取微博热搜
- python爬虫爬取旅游信息(附源码,c
- python爬虫爬取豆瓣电影信息
- 爬取上百张妹子图源码可直接运行
- Python爬虫实战入门教程
- 网络爬虫(pachong_anjuke.py)
- Python-京东抢购助手包含登录查询商品
- python网络爬虫获取景点信息源码
- python爬取维基百科程序语言消息盒(
- python新浪微博爬虫
- 12306爬虫实现
- 中国裁判文书网爬虫
- Python爬虫相关书籍.zip
- 豆瓣电影排行爬虫
- 疫情数据爬虫并绘制柱状图.py
- python新浪微博爬虫,爬取微博和用户
- Python数据爬虫及可视化分析
- 一套最新价值1680元的python爬虫实战全
- 测试工程师相关学习视频(包含pyth
- 11-Python爬虫工程师-App抓取进阶
- 基于10000网页python搭建搜索引擎课程设
- 法律判决文书python爬虫、以及数据处
- python新浪微博爬虫,爬取微博和用户
评论
共有 条评论