资源简介
才刚刚学习python不久,自己琢磨做的一个微博爬虫小程序,可以自动下载其他人的微博图片以及视频,大佬勿喷。
代码片段和文件信息
# -*- coding: utf-8 -*-
“““
本脚本可以爬取用户的图片及其视频
为了减少不必要的麻烦,以移动端(m.weibo.cn)为爬取目标
ID是其主页面url后面数字,如https://m.weibo.cn/u/123456的ID就是123456
“““
import requests
import os
import threading
import sys
import time
head = {
‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/64.0.3282.119 Safari/537.36‘
}
def get_url():
url = ‘https://m.weibo.cn/api/container/getIndex?type=uid&value=‘ + uid
response = requests.get(url)
containerid = response.json()[‘data‘][‘tabsInfo‘][‘tabs‘][1][‘containerid‘]
url = url + ‘&containerid=‘ + containerid + ‘&page=‘
return url
def get_url_list():
url = get_url()
page = 0
pic_list = []
video_list = []
while True:
page += 1
sys.stdout.write(‘page:{}\r‘.format(page))
sys.stdout.flush()
now_url = url+str(page)
response = requests.get(now_url headers = head).json()
# 当用户微博过多时,可能不会继续返回后面的页面,所以暂停一下
if not response[‘ok‘]:
print(‘error page:‘ page)
page -= 1
time.sleep(10)
continue
cards = response[‘data‘][‘cards‘]
for card in cards:
try:
mblog = card[‘mblog‘]
except:
continue
if ‘pics‘ in mblog.keys():
for pic in mblog[‘pics‘]:
pic_list.append(pic[‘large‘][‘url‘])
elif ‘page_info‘ in mblog.keys():
try:
video_list.append(mblog[‘page_info‘][‘media_info‘][‘stream_url‘])
except:
pass
if response[‘data‘][‘cardlistInfo‘][‘page‘] == None:
break
# total = response.json()[‘data‘][‘cardlistInfo‘][‘total‘]
return pic_list video_list
def get_pic(pic_urlpic_num):
name = str(pic_num) + ‘
- 上一篇:Python 简单的登录界面源码
- 下一篇:Python搜索爬虫抓取超高清视频
相关资源
- Python搜索爬虫抓取超高清视频
- Python 简单的登录界面源码
- python编程小游戏汉诺塔hanoi
- 小甲鱼零基础入门学习Python+全套源码
- pygraphviz python3.4 轮子
- 用Python编写潮流计算极坐标
- Python-图像操作
- python建模
- windows将Python添加到注册表
- 位图转g代码轮廓加工源码
- 基于神经网络控制一阶倒立摆小车
- 基于Python爬虫的股票信息爬取保存到
- 基于NMF和PCA实现人脸图像特征提取与
- 基于PCA实现鸢尾花数据集降维
- 基于KNN实现“手写识别”
- 基于sklearn模块的神经网络实现“手写
- 2018最新BAT-python面试题内附答案
- BM3D去噪python代码
- insert_test_data.py
- 栅格投影转换.py
- IDW插值批处理
- 神经网络模型python模板
- python3程序设计习题答案第3版
- python核心基础.txt
- 尚硅谷2018年Python视频
- 基于用户最近邻模型的协同过滤算法
- python自写的车牌识别小程序,完全自
- python面试笔记培训就业必回
- Django+Python搭建的购物网站
- python利用scipy的optimize实现非线性最小
评论
共有 条评论