资源简介
爬取京东手机销售与评价数据,以excel表格形式存储,以条形图形式展示不同品牌手机在淘宝的评价人数。可以通过更改关键字手机实现对其他商品的爬取。详细介绍https://blog.csdn.net/weixin_42911616/article/details/81506154
代码片段和文件信息
import requests
import pygal
import re
from xlwt import Workbook
import matplotlib.pyplot as plt
import xlrd
import time
from pylab import mpl
from selenium import webdriver
from bs4 import BeautifulSoup
mpl.rcParams[‘font.sans-serif‘] = [‘FangSong‘] # 指定默认字体
mpl.rcParams[‘axes.unicode_minus‘] = False # 解决保存图像是负号‘-‘显示为方块的问题
def key_name( drivernumber ):
#获取页面的内容并返回
name = ‘手机‘
URL_1 = “https://search.jd.com/Search?keyword=“
URL_2 = “&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&wq=“
URL_3=“&cid2=653&cid3=655&page=“
URL_4 = “&s=1&click=0“
URL = ( URL_1 + name + URL_2 + name + URL_3+ str(number)+URL_4)
#driver = webdriver.Firefox()
#driver.implicitly_wait(3)
driver.get(URL)
# 模拟下滑到底部操作
for i in range(1 5):
driver.execute_script(“window.scrollTo(0 document.body.scrollHeight);“)
time.sleep(1)
# 将加载好的页面源码给bs4解析
soup = BeautifulSoup(driver.page_source “html.parser“)
t=0
# 进行信息的抽取(商品名称,价格)
goods_info = soup.select(“.gl-item“)
#driver.close()
return goods_info
def manipulation_data( goods_info sales_count sheet ):
#解析获取的HTML源码,获取数据并对数据进行解析
count=0
for info in goods_info:
title = info.select(“.p-name.p-name-type-2 a“)[0].text.strip()
price_str = info.select(“.p-price“)[0].text.strip()
count_str = info.select(“.p-commit“)[0].text.strip()
#print (title)
price_start=price_str.find(‘¥‘)+1
price_end=price_str.find(‘.‘)
price=int(price_str[price_start:price_end])
#print (price)
if(count_str.find(‘\n‘))>=0:
count_start=count_str.find(‘\n‘)+1
else:
count_start=0
if(count_str.find(‘万+‘))>=0:
count=float(count_str[count_start:count_str.find(‘万‘)])*10000
elif(count_str.find(‘+‘))>=0:
count=int(count_str[count_start:count_str.find(‘+‘)])
#print(count)
sheet.write(sales_count[‘line‘]0title)
sheet.write(sales_count[‘line‘]1int(price))
sheet.write(sales_count[‘line‘]2int(count))
for key in sales_count.keys():
if str(title).find(‘荣耀‘)>=0:
相关资源
- python实现SGBM图像匹配算法
- python实现灰度直方图均衡化
- scrapy_qunar_one
- Python学习全系列教程永久可用
- python简明教程.chm
- 抽奖大转盘python的图形化界面
- 双边滤波器实验报告及代码python
- python +MYSQL+HTML实现21蛋糕网上商城
- Python-直播答题助手自动检测出题搜索
- OpenCV入门教程+OpenCV官方教程中文版
- Python 串口工具源码+.exe文件
- Python开发的全栈股票系统.zip
- Python操作Excel表格并将其中部分数据写
- python书籍 PDF
- 利用python绘制散点图
- python+labview+No1.vi
- 老男孩python项目实战
- python源码制作whl文件.rar
- python3.5可用的scipy
- PYTHON3 经典50案例.pptx
- 计算机科学导论-python.pdf
- python模拟鼠标点击屏幕
- windows鼠标自动点击py脚本
- 鱼c小甲鱼零基础学python全套课后题和
- Python 练习题100道
- Practical Programming 2nd Edition
- wxPython Application Development Cookbook
- python 3.6
- Python 3.5.2 中文文档 互联网唯一CHM版本
- python3.5.2.chm官方文档
评论
共有 条评论