资源简介

python自动爬取豆瓣电影TOP250排行榜,存为本地xls

资源截图

代码片段和文件信息

#@Author : ChrisMa
#@QQ : 760303633
#-*- codeing = utf-8 -*-
#@Time : 2020/6/15 14:46
#@File : 061爬虫-豆瓣排名250.py 
#@Sofaware : PyCharm
from bs4 import BeautifulSoup
import re
import urllib.requesturllib.error
import xlwt
import sqlite3
import urllib.parse



def main():
    baseurl = ‘https://movie.douban.com/top250?start=‘

    datalist = getdata(baseurl)
    savepath = ‘.\\豆瓣电影TOP250.xls‘
    savedata(datalistsavepath)
    #askurl(baseurl)

findlink = re.compile(r‘‘)
findimg = re.compile(r‘findtitle = re.compile(r‘tle“>(.*)‘)
findrating = re.compile(r‘(.*)‘)
findjudge = re.compile(r‘(\d*)人评价‘)
findinq = re.compile(r‘(.*)‘)
findbd = re.compile(r‘(.*?)

‘re.S)


#爬取网页
def getdata (baseurl):
    datalist = []
    for i in range (010):
        url = baseurl + str(i*25)

评论

共有 条评论