• 大小: 765B
    文件类型: .py
    金币: 2
    下载: 1 次
    发布日期: 2021-06-13
  • 语言: Python
  • 标签: Python  

资源简介

可以抓取网页中的pdf文档

资源截图

代码片段和文件信息

import urllib2
import osurllib
import re
import shutil
import socket
socket.setdefaulttimeout(60)
def downLoadPicFromURL(urldest_dir):
     try:
         urllib.urlretrieve(urldest_dir)
     except:
         print (‘\tError retrieving the URL:‘dest_dir)

         
html = urllib2.urlopen(“www.baidu.com“).read()
print html
#urlpdf = re.findall(r“http://www.*?pd

评论

共有 条评论