• 大小: 7KB
    文件类型: .py
    金币: 1
    下载: 0 次
    发布日期: 2021-01-10
  • 语言: Python
  • 标签: Python爬虫  

资源简介

自动爬取微信公众号历史所有文章以及封面图片 Selenium + Chromedriver

资源截图

代码片段和文件信息

# -*- coding: utf-8 -*-

from selenium import webdriver
import time
import json
import requests
import re
import random

#微信公众号账号
user=“bigdataservice@cisdi.com.cn“
#公众号密码
password=“302clubEasyData“
#设置要爬取的公众号列表
gzlist=[‘东方国信‘]

#登录微信公众号,获取登录之后的cookies信息,并保存到本地文本中
def weChat_login():
    #定义一个空的字典,存放cookies内容
    post={}

    #用webdriver启动谷歌浏览器
    print(“启动浏览器,打开微信公众号登录界面“)
    driver = webdriver.Chrome(executable_path=r‘D:\360安全浏览器下载\chromedriver_win32\chromedriver.exe‘)
    #打开微信公众号登录页面
    driver.get(‘https://mp.weixin.qq.com/‘)
    #等待5秒钟
    time.sleep(5)
    print(“正在输入微信公众号登录账号和密码......“)
    #清空账号框中的内容
    driver.find_element_by_xpath(‘//*[@id=“header“]/div[2]/div/div/form/div[1]/div[1]/div/span/input‘).clear()
    #自动填入登录用户名
    driver.find_element

评论

共有 条评论