大学排名爬虫

大小: 3KB

文件类型: .py

金币: 1

下载: 0 次

发布日期: 2021-06-04
语言: Python
标签: python spider data
高速下载
资源简介

简单的爬虫实例，爬取了大学排名的相关信息，适合爬虫入门
资源截图

小图大图
代码片段和文件信息

# -*- coding: utf-8 -*-
“““
Created on Thu Aug  9 16:24:29 2018

@author: Administrator
“““


from bs4 import BeautifulSoup
import requests

def getHtmlUrl（url）:
    try:
        r=requests.get（url）
        r.raise_for_status（）
        r.encoding=r.apparent_encoding
        return r.text
    except baseException as e:
        print（e）

def getData（html）:
    title=[]
    range_num=[]
    rating_num=[]
    province=[]
    source_num=[]
    data={}
    soup=BeautifulSoup（html‘html.parser‘）
    uni_all=soup.find_all（‘tr‘class_=‘alt‘）

    for i in range（010）:
        range_num.append（uni_all[i].find_all（‘td‘）[0].text）
        title.append（uni_all[i].find_all（‘td‘）[1].find（‘div‘）.text）
        province.append（uni_all[i].find_all（‘td‘）[2].text）
        rating_num.append（uni_all[i].find_all（‘td‘）[3].text）
        source_num.append（uni_all[i].find_all（‘td‘）[4].text）
        
    data[‘title‘]=title
    data[‘rating_num‘]=rating_num
    data[‘range_num‘]=range_num
    data[‘province‘]=province
    data[‘souce_num‘]=source_num
    return data

def show（data）:
    f=open（“D://uni.html“‘w‘）
    f.write（““）
    f.write（““）
    f.write（““）
    
    f.write（““）
    f.write（““）
    f.write（“排名 “）
    f.write（“ 学校名

						   

						  
						 

						
							
								
									上一篇：annoy-1.15.2-cp36-cp36m-win_amd64.whl 
									下一篇：Scrapy爬虫框架教程二-- 爬取豆瓣电影TOP250 
								
							
							
								
									挑错
									打印
								
							
						
						
					    
					   
					    
						    
							
							
							 
							 评论
							  
							   
							    
								 
								 
								 
								 
								 
								
								 
								 
								 
								 
							    
							   
							  
							  共有  条评论
							 
							  
							  
							  
							  
							 
							 
						    
					  	

					    
						 
						  
						   
						   
							 
								   举报  
								
							 
						   
						   
						   
						    顶一次  
						    踩一次 1400 次  
						   
						  
						 
					   

					  
				 
				
				 
				 
				 
			    
			   
			  
			 
			 
			  
			   
			   
			   
				相关资源 
				 
				  
				  
						  二级考试python试题12套（包括选择题和   
					 
 
						  pywin32_python3.6_64位   
					 
 
						  python+ selenium教程   
					 
 
						  PycURL（Windows7/Win32）Python2.7安装包 P   
					 
 
						  英文原版-Scientific Computing with Python    
					 
 
						  7.图像风格迁移   基于深度学习  pyt   
					 
 
						  基于Python的学生管理系统   
					 
 
						  A Byte of Python（简明Python教程）（第   
					 
 
						  Python实例174946   
					 
 
						  Python 人脸识别   
					 
 
						  Python 人事管理系统   
					 
 
						  基于python-flask的个人博客系统   
					 
 
						  计算机视觉应用开发流程   
					 
 
						  python 调用sftp断点续传文件   
					 
 
						  python socket游戏   
					 
 
						  基于Python爬虫爬取天气预报信息   
					 
 
						  python函数编程和讲解   
					 
 
						  Python开发的个人博客   
					 
 
						  基于python的三层神经网络模型搭建   
					 
 
						  python实现自动操作windows应用   
					 
 
						  python人脸识别（opencv）   
					 
 
						  python 绘图（方形、线条、圆形）   
					 
 
						  python疫情卡UN管控   
					 
 
						  python 连连看小游戏源码   
					 
 
						  基于PyQt5的视频播放器设计   
					 
 
						  一个简单的python爬虫   
					 
 
						  csv文件行列转换python实现代码   
					 
 
						  Python操作Mysql教程手册   
					 
 
						  Python Machine Learning Case Studies   
					 
 
						  python获取硬件信息   
					 
		
			     
				 
				
				
			    
			   
			  

			 
			 
			 
		    
		   
		  
		 
	    
	   
  
  
  
  
      
         
         × 
		 
      
      
         
         
      
  
   
      
         
      × 
       
       
       
      
   

  
    

  
   
    
     
      
       
        
        关于 
           
        发布源码 
        版权说明 
		川公网安备 51152502000135号 
        蜀ICP备17041055号 
         
        举报邮箱softcode@aliyun.com