资源简介
爬取企查查网站上公司的工商信息,路径大家根据自己情况自行修改,然后再在工程路径下创建个company.txt,里面输入想要爬取的公司名,就会生成该公司的工商信息网页。
代码片段和文件信息
# -*- coding-8 -*-
import requests
import lxml
from bs4 import BeautifulSoup
import xlwt
import re
import urllib
import random
import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.bufferencoding=‘utf8‘) #改变标准输出的默认编码
def get_user_agent():
user_agent_list = [
“Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML like Gecko) Chrome/22.0.1207.1 Safari/537.1“
“Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML like Gecko) Chrome/20.0.1132.57 Safari/536.11“
“Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML like Gecko) Chrome/20.0.1092.0 Safari/536.6“
“Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6 (KHTML like Gecko) Chrome/20.0.1090.0 Safari/536.6“
“Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1 (KHTML like Gecko) Chrome/19.77.34.5 Safari/537.1“
“Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML like Gecko) Chrome/19.0.1084.9 Safari/536.5“
“Mozilla/5.0 (Windows NT 6.0) AppleWebKit/536.5 (KHTML like Gecko) Chrome/19.0.1084.36 Safari/536.5“
“Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML like Gecko) Chrome/19.0.1063.0 Safari/536.3“
“Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.3 (KHTML like Gecko) Chrome/19.0.1063.0 Safari/536.3“
“Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/536.3 (KHTML like Gecko) Chrome/19.0.1063.0 Safari/536.3“
“Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML like Gecko) Chrome/19.0.1062.0 Safari/536.3“
“Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML like Gecko) Chrome/19.0.1062.0 Safari/536.3“
“Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML like Gecko) Chrome/19.0.1061.1 Safari/536.3“
“Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML like Gecko) Chrome/19.0.1061.1 Safari/536.3“
“Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.3 (KHTML like Gecko) Chrome/19.0.1061.1 Safari/536.3“
“Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML like
相关资源
- 一加云服务照片批量导出 Python爬虫
- Python爬虫抓取Ebay页面
- Python 搜狗词库的批量
- python爬取小说源码,仅供学习使用
- GrabClass.py爬取武汉理工大学课表
- py新浪微博爬虫通过修改最后的uid值即
- 高效爬取微博数据python3实现
- python3网络爬虫与开发实战崔庆才PDF百
- 基于Python专业网络爬虫的设计与实现
- 爬虫视频案例课程----崔庆财
- 微博关键字爬虫代码
- python爬取豆瓣每个账户对电影的评分
- 使用python对淘宝商品信息数据进行爬
- Python_百科爬虫
- python爬虫Scrapy(一)-我爬了boss数据
- 豆瓣电影信息Python爬虫存入MongoDB.一分
- Python爬虫文件:爬取图片的程序.py
- Python搜索爬虫抓取超高清视频
- 微博图片视频小爬虫
- 基于Python爬虫的股票信息爬取保存到
- Python简单网页爬虫
- Python爬虫每日抓取必应壁纸
- Python 3网络爬虫开发实战
- isbn查询书籍详细信息2.0
- 大批量图片爬虫工具可以自动上万张
- 利用爬虫获取IP的地理位置
- Python爬虫源码—爬取猫途鹰官方旅游
- 爬取瓜子二手车.py
- 用python实现一个百度百科的爬虫工具
- 问卷星爬虫带验证码
评论
共有 条评论