淘宝网页数据爬虫

大小: 1KB

文件类型: .py

金币: 1

下载: 0 次

发布日期: 2021-05-25
语言: Python
标签: 淘宝爬虫

高速下载

资源简介

利用requests和beautifulsoup对淘宝网站进行网页爬取，获取指定关键字的商品信息，直观地反馈在屏幕上

资源截图

小图大图

代码片段和文件信息

import requests
import re
def getHTML（url）:
    try:
        r = requests.get（url）
        r.raise_for_status（）
        r.encoding = r.apparent_encoding
        return r.text
    except:
        print（‘获取失败‘）
def jiexi（ilthtml）:
    try:
        mz = re.findall（r‘\“raw_title\“\:\“.*?\“‘html）
        jg = re.findall（r‘\“view_price\“\:\“[\d\.]*\“‘html）
        for i in range（len（mz））:
            name = eval（mz[i].split（‘:‘）[1]）
            price = eval（jg[i].split（‘:‘）[1]）
            ilt.append（[nameprice]）
    except:
        print（‘获取

上一篇：REAPER的脚本程序汇总
下一篇：python 从xml文件中提取有用信息转csv存储

共有条评论

淘宝网页数据爬虫

资源简介

资源截图

代码片段和文件信息

评论

相关资源