• 大小: 1KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-05-25
  • 语言: Python
  • 标签: 淘宝  爬虫  

资源简介

利用requests和beautifulsoup对淘宝网站进行网页爬取,获取指定关键字的商品信息,直观地反馈在屏幕上

资源截图

代码片段和文件信息

import requests
import re
def getHTML(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        print(‘获取失败‘)
def jiexi(ilthtml):
    try:
        mz = re.findall(r‘\“raw_title\“\:\“.*?\“‘html)
        jg = re.findall(r‘\“view_price\“\:\“[\d\.]*\“‘html)
        for i in range(len(mz)):
            name = eval(mz[i].split(‘:‘)[1])
            price = eval(jg[i].split(‘:‘)[1])
            ilt.append([nameprice])
    except:
        print(‘获取

评论

共有 条评论