python课设--网购平台比价系统天猫、京东、拼多多.zip

大小: 1.48MB

文件类型: .zip

金币: 2

下载: 0 次

发布日期: 2023-09-02
语言: Python
标签: python 课程设计

高速下载

资源简介

本人进行学校python课程设计的实战成果，实现的整个过程详见博客。此程序利用网络爬虫技术获取平台购物信息从而实现跨平台比价功能以及相关扩展功能，难度适中，适合作为课设进行开发。

资源截图

小图大图

代码片段和文件信息

import requests
import re
import time
import os
from bs4 import BeautifulSoup as bs
from selenium import webdriver
from Goods import Goods

class CrawlProgram:

    def getHTMLText（selfurl）:
        try:
            kv = {‘user-agent‘: ‘Mozilla/5.0‘}
            r = requests.get（url headers=kv timeout=30）
            r.raise_for_status（）
            r.encoding = r.apparent_encoding
            return r.text
        except:
            print（‘获取HTML失败‘）
            return ““

    def getItemsFromTmall（selfkeywordnumber）:
        # 单个页面最多获取60个商品
        url = ‘https://list.tmall.com/search_product.htm?q=‘ + keyword
        soup = bs（self.getHTMLText（url） ‘html.parser‘）
        try:
            # get_title
            title_ls = []
            for item in soup.find_all（‘p‘ class_=‘producttitle‘）:
                if item.find（‘a‘）:
                    title_ls.append（item.find（‘a‘）.get（‘title‘））
                else:
                    title_ls.append（‘无相关信息‘）
            # get_href and id
            href_ls = []
            id_ls = []
            reg = re.compile（r‘\d{515}‘）
            for item in soup.find_all（‘p‘ class_=‘producttitle‘）:
                if item.find（‘a‘）:
                    href = ‘https:‘ + item.find（‘a‘）.get（‘href‘）
                    href_ls.append（href）
                    id = reg.findall（href）
                    if id:
                        id_ls.append（‘T‘+id[0]）
                    else:
                        id_ls.append（‘无相关信息‘）
                else:
                    href_ls.append（‘无相关信息‘）
            # get_monthly_sales
            sale_ls = []
            for item in soup.find_all（‘p‘ class_=‘productStatus‘）:
                if item.find（‘em‘）:
                    sale_ls.append（item.find（‘em‘）.string[:-1]）
                else:
                    sale_ls.append（‘无相关信息‘）
            # get_shop_info
            shop_ls = []
            for item in soup.find_all（‘p‘ class_=‘productStatus‘）:
                if item.find（‘span‘ class_=True）:
                    shop_ls.append（item.find（‘span‘ class_=True）.get（‘data-tnick‘））
                else:
                    shop_ls.append（‘无相关信息‘）
            # get_price
            price_ls = []
            for item in soup.find_all（‘p‘ class_=‘productPrice‘）:
                if item.find（‘em‘）:
                    price_ls.append（item.find（‘em‘）.get（‘title‘））
                else:
                    price_ls.append（‘无相关信息‘）
            items = []
            for num in range（len（title_ls））:
                goods= Goods（id_ls[num]‘天猫‘title_ls[num]shop_ls[num]eval（price_ls[num]）sale_ls[num]href_ls[num]）
                items.append（goods）
            return items[:number]
        except:
            print（‘获取天猫商品信息失败‘）
            return []

    def getItemsFromJD（selfkeywordnumber）:
        # 单个页面最多获取30个商品，销量为月销量
        url = ‘https://search.jd.com/Search?keyword=‘

属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件        9651  2020-06-12 12:42  python课设--网购平台比价系统（天猫、京东、拼多多）\CrawlProgram.py
     文件        3068  2020-06-12 09:23  python课设--网购平台比价系统（天猫、京东、拼多多）\DBConnection.py
     文件     3566280  2019-10-12 08:38  python课设--网购平台比价系统（天猫、京东、拼多多）\geckodriver.exe
     文件        2786  2020-06-11 13:31  python课设--网购平台比价系统（天猫、京东、拼多多）\Goods.py
     文件        1959  2020-06-10 21:21  python课设--网购平台比价系统（天猫、京东、拼多多）\GoodsList.py
     文件       12281  2020-06-11 18:30  python课设--网购平台比价系统（天猫、京东、拼多多）\Gui.py
     文件        1394  2020-06-12 09:26  python课设--网购平台比价系统（天猫、京东、拼多多）\操作介绍.txt

上一篇：卷积神经网络的Python实现 -《卷积神经网络的Python实现》11章-13章.pdf
下一篇：Python.2.and.3.Compatibility

共有条评论

python课设--网购平台比价系统天猫、京东、拼多多.zip

资源简介

资源截图

代码片段和文件信息

评论

相关资源