python+selenium爬取亚马逊商品评论详情

大小: 2KB

文件类型: .py

金币: 1

下载: 1 次

发布日期: 2021-06-10
语言: Python
标签: Amazon

高速下载

资源简介

亚马逊评论详情页是动态加载的，不过多折腾，直接用selenium进行爬取；用pandas写入csv文件，解决乱码、无序问题；

资源截图

小图大图

代码片段和文件信息

# coding=utf-8

import time
from selenium import webdriver
from pandas import Dataframe


class Comment（object）:
    def __init__（self）:
        self.url = ‘https://www.amazon.com/PISEN-20000mAh-Portable-Capacity-External/product-reviews/B075D4SS7F/ref=cm_cr_dp_d_show_all_btm?ie=UTF8&reviewerType=all_reviews‘
        self.driver = webdriver.Chrome（）
        # self.file = open（‘demo_Amazon-comment.json‘ ‘w‘ encoding=‘utf-8‘）
        self.temp = {}

    def __del__（self）:
        self.driver.close（）
        # self.file.close（）

    def parse_data（self）:
        # 获取所有节点列表
        time.sleep（3）
        node_list = self.driver.find_elements_by_xpath（‘//*[@id=“cm_cr-review_list“]/div/div‘）
        # print（len（node_list））
        # 遍历列表
        for node in node_list:
            self.temp[‘level‘].append（node.find_element_by_xpath（‘./div[1]/a[1]‘）.get_attribute（‘title‘））
            self.temp[‘name‘].append（node.find_element_by_xpath（‘./div[2]/span[1]/a‘）.text）
            self.temp[‘date‘].append（node.find_element_by_xpath（‘./div[2]/span[4]‘）.text）
            self.temp[‘colour‘].append（node.find_element

上一篇：基于selective_search对手写数字串进行分割，并基于tensorflow在mnist训练好的模型进行识别
下一篇：微电网python模型

共有条评论

python+selenium爬取亚马逊商品评论详情

资源简介

资源截图

代码片段和文件信息

评论

相关资源