• 大小: 13KB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2021-05-12
  • 语言: Python
  • 标签: python  

资源简介

1 Python_百科爬虫

资源截图

代码片段和文件信息

import urllib.request

class HtmlDownloader(object):
    
    def download(selfurl):
        if url is None:
            return None
        request1 = urllib.request.Request(url)
        response = urllib.request.urlopen(request1)

        if response.getcode()!=200:
            return None
        
        return response.read()


 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件        2153  2017-07-20 14:42  Python_百科爬虫.pyproj
     文件         227  2017-07-20 14:42  Python_百科爬虫.pyproj.user
     目录           0  2017-08-10 18:12  __pycache__\
     文件         603  2017-07-20 13:33  __pycache__\html_downloader.cpython-36.pyc
     文件        1081  2017-07-20 13:40  __pycache__\html_outputer.cpython-36.pyc
     文件        1320  2017-07-20 13:38  __pycache__\html_parser.cpython-36.pyc
     文件        1170  2017-07-20 12:06  __pycache__\url_manager.cpython-36.pyc
     文件         479  2017-07-20 14:42  __pycache__\wpf.cpython-36.pyc
     文件         350  2017-07-20 13:33  html_downloader.py
     文件         774  2017-07-20 13:40  html_outputer.py
     文件        1164  2017-07-20 13:37  html_parser.py
     文件       26346  2017-08-17 11:42  output.html
     文件        1490  2017-08-17 11:46  spider_main.py
     文件         666  2017-07-20 12:06  url_manager.py
     文件         141  2017-07-20 14:41  wpf.py
     文件         232  2017-07-20 14:40  wpf.xaml

评论

共有 条评论