资源简介
【实例简介】
主要功能模块及界面(截图)
代码的入口是
它首先是让用户输入书名,调用了下载模块
调用下载模块后会获得到小说的URL和小说名字,程序把获得小说的网址调用给获取章节模块
调用获取章节模块后会获得到小说的URL,得到小说的URL后,把传过来的URL的页面内容进行解析,把小说的章节个解析获取下了。并把传输显示和写入模块,进行每一个章节的URL内容解析,把每章的内容给循环取出,写入到TXT文本里面,而且还显示当前写入的章节名和爬取网站的总进度。
代码片段和文件信息
import requests
import re
import time
import random
def download(book_name):
# 下载模块
search_real_url = ‘https://www.biquge5200.com/modules/article/search.php?searchkey=‘ + book_name
try:
novel_source = requests.get(search_real_url).text
reg1 = r‘(.*?) .*?(.*?) ‘
# 所有搜索到的结果(包括小说网址、名称、作者姓名)
novel_list = re.findall(reg1 novel_source re.S)
# 判断是否有数据返回
if len(novel_list) == 0:
print(‘搜索不到你要的小说‘)
except Exception as e:
print(e)
for novel_url novel_name novel_author in novel_list:
if novel_name == book_name:
print(‘书名:%s 作者:%s‘ % (novel_name novel_author))
return novel_url novel_name
def get_chapter(url):
# 获取章节页面模块
try:
# 章节页面源代码
chapter_page_source = requests.get(url).text
reg2 = r‘(.*?) ‘
chapter_list = re.fi
- 上一篇:唐僧大战白骨精(源码)
- 下一篇:python核心编程第二版-习题答案
相关资源
- python爬取豆瓣top250电影信息
- 豆瓣电影排名250爬取,并存excel
- python爬取接口json数据,并显示在Pre
- python爬取微博用户信息,绘制词云图
- python爬取淘宝商品价格
- Python爬取国内大学排名
- Python爬取公众号文章
- python 爬虫爬取京东代码
- python爬虫爬取当当网
- python 爬取豌豆荚APP的爬虫
- 爬取网站信息并写入Excel
- python 爬取网址数据
- python 爬取QQ音乐并至本地
- python 斗鱼直播间爬取代码
- selenium对京东淘宝商品爬取
- spash对京东商品爬取
- Scrapy框架简单应用:爬取免费的的西刺
- python采集起点小说 并保存到txt文件
- python 采集有声小说至本地文件夹(幻
- python 爬取移动端微博信息
- python 天气网爬虫(爬取天气预报)
- python爬取图片网站(将图片至本地)
- python 爬虫入门级(BeautifulSoup爬取最好
- 爬虫爬取携程机票信息
- 基于Django2、echarts的爬取智联招聘信息
- python爬取贝壳网小区数据
- python爬取百度贴吧图片(图片到本地
- python爬虫(爬取新浪微博数据)
- python爬取豆瓣影评
- python爬取微博评论
评论
共有 条评论