资源简介
python爬取淘宝商品新信息,如果出现乱码,请加上如下代码:
import sys reload(sys) sys.setdefaultencoding('utf8')
代码片段和文件信息
#coding=utf-8
# 根据输入的关键字查询淘宝商品数据
# 淘宝编码是gbk
import re
import requests
url = ‘https://s.taobao.com/search‘
sp = input(‘请输入查询商品:‘)
page_num = input(‘请输入查询页码(以逗号隔开):‘)
ll = page_num.split(‘‘)
if len(ll) == 2 :
pass
elif len(ll) < 2:
raise ValueError(‘请输入查询页码信息格式如下:12‘)
payload = {‘q‘: sp‘s‘: ‘1‘‘ie‘:‘utf8‘} #字典传递url参数
# file = open(‘taobao_test.txt‘‘w‘encoding=‘utf-8‘)
for k in range(int(ll[0])int(ll[1])): #100次,就是100个页的商品数据
# for k in range(int(1)100):
payload [‘s‘] = 44*k+1 #此处改变的url参数为s,s为1时第一页,s为45是第二页,89时第三页以此类推
resp = requests.get(url params = payload)
print((resp.url)) #打印访问的网址
resp.encoding = ‘utf-8‘ #设置编码
print(resp.text)
title = re.findall(r‘“raw_title“:“([^“]+)“‘resp
- 上一篇:python 爬取豌豆荚APP的爬虫
- 下一篇:python 爬去代理ip
相关资源
- python一个打砖块的小游戏
- python实验指导书 图文高清版
- python主动安装第三方库
- python爬取豆瓣top250电影信息
- FastAPI入门级
- python绘制 大蟒蛇
- python小程序(数组排序)
- Python去水印(基于cv2)
- Python 数据结构入门 - 二叉搜索树(
- python空心电感计算器
- python除法.docx
- 抽奖背后的秘密(python抽奖逻辑)
- 绘制统计学直方图茎叶图(matplotlib)
- python求解标准差
- python数据分析与处理
- 利用Python将照片在Excel中利用点阵图显
- python turtle 跳房子
- python 人群计数
- Python调用第三方API换脸
- “去哪儿吃”帮你选餐厅(python代码
- python 控制台登陆密码验证
- KNN算法的Python实现(datingrecd.ipynb)
- python核心编程第二版-习题答案
- python爬取笔趣阁小说
- Python程序设计基础试题以及答案(3
- python聊天-服务端与客户端
- python递归求最大公约数
- 用python画皮卡丘(基于turtle)
- 伟哥的python私房菜(中国程序员).
- pip一键升级(python脚本)
评论
共有 条评论