• 大小: 1.49MB
    文件类型: .pdf
    金币: 1
    下载: 0 次
    发布日期: 2023-10-25
  • 语言: Python
  • 标签: python  for  information  

资源简介

本书讲解了如何使用python网络爬虫程序,内容包括网络爬虫简介,从页面抓取数据的三种方法,提取缓存中的数据。使用多个线程和进程进行并发抓取。如何抓取动态页面中的内容。与表单进行交互,处理页面中的验证码问题。以及使用scarpy和Portia来来进行数据抓取,并在最后使用本书介绍的数据抓取技术对几个真实的网站进行了抓取

资源截图

代码片段和文件信息

评论

共有 条评论