资源简介
需要创建 D:/weibo/weibo_crawl.txt 文件,然后运行该示例即可
代码片段和文件信息
# -*- coding:utf-8 -*-
‘‘‘
Created on 2018年3月9日
@author: ora_jason
‘‘‘
from lxml import html
import requests
import json
import re
import os
import time
import urllib.request
class CrawlWeibo:# 获取指定博主的所有微博cards的list
def getCards(self id page): # id(字符串类型):博主的用户id;page(整型):微博翻页参数
ii = 0
list_cards = []
while ii < page:
ii = ii + 1
print(‘正在爬取第%d页cards‘ % ii)
url = ‘https://m.weibo.cn/api/container/getIndex?type=uid&value=‘ + id + ‘&containerid=107603‘ + id + ‘&page=‘ + str(ii)
print(url)
response = requests.get(url headers=headers)
ob_json = json.loads(response.text) # ob_json为dict类型
list_cards.append(ob_json[‘data‘][‘cards‘]) # ob_json[‘data‘][‘cards‘]为list类型
time.sleep(2)
print(‘暂停2秒‘) # 爬完一页所有微博的card
相关资源
- 《Python3爬虫、数据清洗与可视化》
- Python爬虫项目-12306票务查询
- 从零开始学Python网络爬虫所有源代码
- Python爬虫教程基于Python3.X
- 用Python写网络爬虫PDF&源码
- Python编程:从入门到实践(超清版)
- Python网络爬虫与信息提取课件
- python三剑客
- Python爬虫开发项目实战电子书 本书为
- 《Python爬虫开发与项目实战》pdf+源码
- 《Python 3爬虫、数据清洗与可视化实战
- 23个Python爬虫项目
- python3爬虫资料
- python 爬虫爬取简历
- Python爬虫开发与项目实战PDF与源码.
- 麻瓜编程 实用主义学Python2018
- 《Python3网络爬虫开发实战代码》.zi
- Python网络爬虫从入门到实践作者: 唐松
- python爬取漏洞库.zip
- python爬虫开发与项目实战
- python爬虫项目开发实战+源代码
- 2019马哥全新Python全栈+自动化+爬虫+数
- 京东商品图片爬虫
- 抓取豆瓣影评并制作词云
- Python爬取豆瓣图书信息
- python爬虫集(豆瓣电影、书籍、小组
- 技术更新,战术升级!Python爬虫案例
- python文本相似度分析
- python 网络爬虫
- Python+淘宝网商品数据分析+原代码.t
评论
共有 条评论