• 大小: 727KB
    文件类型: .doc
    金币: 2
    下载: 1 次
    发布日期: 2021-07-10
  • 语言: Python
  • 标签: 网络爬虫  

资源简介

以世纪佳缘网为例,思考自己所需要的数据资源,并以此为基础设计自己的爬虫程序。应用python伪装成浏览器自动登陆世纪佳缘网,加入变量打开多个网页。通过python的urllib2函数进行世纪佳缘网源代码的获取。用正则表达式分析源代码,找到所需信息导入excel。连接数据库,将爬下的数据存储在数据库中。

资源截图

代码片段和文件信息

评论

共有 条评论