资源简介
python_爬取网上资源存入数据库中
轻松实现小爬虫
关键:绝对能跑的代码
代码片段和文件信息
# _*_ coding:utf-8 _*_
from urllib import request
from bs4 import BeautifulSoup #爬虫的一种插件,自己下载
import pymysql
db_config ={
‘host‘:‘XX.XX.XX.XX‘ #数据库服务器IP地址
‘port‘:3306 #数据库服务器端口号,一般是3306
‘user‘:‘root‘ #数据库用户名
‘password‘:‘xxxx‘ #数据库密码
‘db‘:‘test_spider‘ #数据库表名称
‘charset‘:‘utf8‘ #数据字符类型
}
connection = pymysql.connect(**db_config)
url = r‘http://www.jianshu.com/‘
headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/55
评论
共有 条评论