• 大小: 9.78 MB
    文件类型: .pdf
    金币: 1
    下载: 0 次
    发布日期: 2020-12-14
  • 语言: Python
  • 标签: python  网络爬虫  

资源简介

本书讲解了如何使用P川lOil来编写网络爬虫程序, 内容包括网络爬虫简介, 从页面中抓取数据的三种方法, 提取缓存中 的数据, 使用多个线程和进程来进行并发抓取, 如何抓取动态页面中 的内容, 与表单进行交互 , 处理页面中的验证码问题, 以及使用 Sca rpy和 Portia 来进行数据抓取, 并在最后使 用本书介绍的数据抓取技术对几个真实的网站进行了抓取, 旨在帮助读者活学活用书中介绍的技术 。

资源截图

代码片段和文件信息

评论

共有 条评论