资源简介

适合爬虫初学者的必备入门demo,效果如下:

要求环境python3.7,安装库

requests,xlwt,re,os
采用新手友好的原始正则对文本进行筛选,爬取豆瓣top250电影信息,生成excel表格,可在pycharm中直接运行,
默认保存目录D:/test

资源截图

代码片段和文件信息

import requests
import xlwt
import re
import os
#保存数据生成excel表格
def save_date(datalistsavepath):
     if not os.path.exists(savepath):
         print(‘未存在文件夹‘savepath‘创建中‘)
         os.makedirs(savepath)
     else:
         print(‘已存在文件夹,保存中‘)
     savepath=savepath+‘/豆瓣top250电影.xls‘
     book=xlwt.Workbook(encoding=‘utf-8‘style_compression=0)
     sheet=book.add_sheet(“豆瓣电影Top248“cell_overwrite_ok=True)
     col=(‘排名‘‘名称‘‘详细信息‘‘评分‘‘介绍‘)
     for i in range(05):
         sheet.write(0icol[i])
     for i in range(0len(datalist)):
          sheet.write(i+10datalist[i].get(‘index‘))
          sheet.write(i+1 1 datalist[i].get(‘title‘))
          sheet.write(i+1 2 datalist[i].get(‘info‘))
          sheet.write(i+1 3 datalist[i].get(‘score‘))
         

评论

共有 条评论