Python爬取论文标题、作者、摘要等信息并存入MySQL源代码

大小: 2KB

文件类型: .py

金币: 1

下载: 0 次

发布日期: 2021-06-14
语言: Python
标签: python爬虫

高速下载

资源简介

Python爬取论文标题、、摘要等信息并存入MySQL。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

资源截图

小图大图

代码片段和文件信息

import requests
from bs4 import BeautifulSoup
import re
import pymysql

global count

def getUrls（）:
    all_items = 12*2+3
    urls = []
    partstr = “http://crad.ict.ac.cn/CN/volumn/volumn_“
    for i in range（all_items+1）:
        strone = partstr + str（1300+i） + “.shtml“
        urls.append（strone）
    for url in urls:
        yield url

def getHTMLText（url）:
    try:
        r = requests.get（urltimeout=50）
        r.raise_for_status（）
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return “error“

def getConnection（）:
    connection = pymysql.connect（
        host=“localhost“
        port=3306
        user=“root“
        password=“123456“
        database=“adnm“
        charset=“utf8“
        cursorclass=pymysql.cursors.DictCursor
    ）
    return connection

def parsePage（infoList html）:
    soup = BeautifulSoup（html“html.parser“）
    item = soup（name=‘a‘attrs={“class“:“biaoti“}）
    biaoti = re.findall（r‘target=“_blank“>（.*?）    item = soup（name=‘dd‘attrs={“class“:“zuozhe“}）
    zuozhe = re.findall（r‘class=“zuozhe“>（.*?）

上一篇：绘制yolov3 P-R曲线的脚本draw_pr_py3.py
下一篇：深度信念网络分类算法python程序.docx

共有条评论

Python爬取论文标题、作者、摘要等信息并存入MySQL源代码

资源简介

资源截图

代码片段和文件信息

评论

相关资源