python爬取视频源代码

大小: 1KB

文件类型: .py

金币: 1

下载: 1 次

发布日期: 2021-06-09
语言: Python
标签: python 爬虫

高速下载

资源简介

利用python中的re和requests模块，实现对网站中的视频进行爬取，对于图片和文字的爬取也是同样的原理，重点是学会就网页html标签的正确正则就能获取到我们需要的数据，这里是用的单线程爬取

资源截图

小图大图

代码片段和文件信息

# -*- coding: cp936 -*-
import re
import requests

response=requests.get（“http://www.xiaohuar.com/v/“）  #以下载校花网中的视频为例
print（response.status_code）  #打开网页的响应状态码 若返回200-表示成功
print（response.content）   #返回字节信息
print（response.text）   #返回文本内容

#正则，匹配该网站中的视频播放页的页面地址
iter=re.finditer（r‘class=“items“.*?href=“（.*?）“‘response.text）
j=1;
for i in iter:    
    url=i.group（1）
    print（url） #打印视频播放页的页面地址，用来观察正则是否正确
    result=requests.get（url）
    try:   
		#正则，匹配视频的下载地址
        mp4_url=re.findall（r‘id=“media“.*?src=“（.*?）“‘result.textre.S）[0]
        #获取视频的扩展名，是mp4就下载，不是mp4就不下载

上一篇：利用python的scrapy爬取慕课网全站课程数据存入Mysql
下一篇：openmv定点代码

共有条评论

python爬取视频源代码

资源简介

资源截图

代码片段和文件信息

评论

相关资源