资源简介
Python脚本用于获取百度搜索结果中的标题和URL。
输入:百度关键词及搜索页面数
输出:标题和URL
代码片段和文件信息
#encoding: utf-8
#采集SERP搜索结果标题
import urllib2
from bs4 import BeautifulSoup
#获取title和url
def GettitleUrl(urlres_titleres_urlbShowRes):
try:
##获取Html源码
req = urllib2.Request(url)
response= urllib2.urlopen(reqNone3)#设置超时时间
data = response.read()#.decode(‘utf-8‘‘ignore‘)
##提取搜索结果SERP的标题和链接
soup = BeautifulSoup(‘‘.join(data)‘lxml‘)
for i in soup.findAll(“h3“):
temp_title = i.a.text.encode(“utf-8“)
temp_url = i.a.get(‘href‘)
if bShowRes==1:
print temp_title
print temp_url
res_title.append(temp_title)
res_url.append(temp_url)
except:
pass
相关资源
- python实现SGBM图像匹配算法
- python实现灰度直方图均衡化
- scrapy_qunar_one
- Python学习全系列教程永久可用
- python简明教程.chm
- 抽奖大转盘python的图形化界面
- 双边滤波器实验报告及代码python
- python +MYSQL+HTML实现21蛋糕网上商城
- Python-直播答题助手自动检测出题搜索
- OpenCV入门教程+OpenCV官方教程中文版
- Python 串口工具源码+.exe文件
- Python开发的全栈股票系统.zip
- Python操作Excel表格并将其中部分数据写
- python书籍 PDF
- 利用python绘制散点图
- python+labview+No1.vi
- 老男孩python项目实战
- python源码制作whl文件.rar
- python3.5可用的scipy
- PYTHON3 经典50案例.pptx
- 计算机科学导论-python.pdf
- python模拟鼠标点击屏幕
- windows鼠标自动点击py脚本
- 鱼c小甲鱼零基础学python全套课后题和
- Python 练习题100道
- Practical Programming 2nd Edition
- wxPython Application Development Cookbook
- python 3.6
- Python 3.5.2 中文文档 互联网唯一CHM版本
- python3.5.2.chm官方文档
评论
共有 条评论