资源简介
python爬取360搜索引擎图片,用于物体识别和样本训练 自定义函数def getBaiduImag(category,length,path),用于采集360图片,三个参数分别为搜索的“关键词”category,采集的图片数量length,保存图片的路径path。 自动检索当前下载目录下已有的图片数量,在此基础上再次采集length张图片。 需要导入的库文件有import requests、import json、import urllib、import os
代码片段和文件信息
import requests
import json
import urllib
import pypinyin
import os
# 不带声调的(style=pypinyin.NORMAL)
def pinyin(word):
s = ‘‘
for i in pypinyin.pinyin(word style=pypinyin.NORMAL):
s += ‘‘.join(i)
return s
Collect_Picture_category = ‘苹果‘
Collect_Picture_length = 100
Collect_Picture_SavePath = ‘D:/test/1/‘
Collect_Picture_Source_Index = 2
Collect_Picture_Source = pinyin(‘360图片‘)
def CurrentPicture_list():
filename_number = []
Collect_Pic_path = Collect_Picture_SavePath[0:len(Collect_Picture_SavePath) - 1]
for files in os.listdir(Collect_Pic_path):
if files.endswith(“.jpg“): # 填写规则
(filename extension) = os.path.splitext(files)
if filename[0:len(Collect_Picture_Source + ‘_‘ + pinyin(
Collect_Picture_category) + ‘_‘)] == Collect_Picture_Source + ‘_‘ + pinyin(
Collect_Picture_category) + ‘_‘:
filename_number.append(
filename[len(Collect_Picture_Source + ‘_‘ + pinyin(Collect_Picture_category) + ‘_‘):])
return filename_number
#从百度图片搜索结果中抓取图片,相当于在搜索框中直接搜索
def get360Imag(Collect_Picture_categoryCollect_Picture_lengthCollect_Picture_SavePath):
if not os.path.exists(Collect_Picture_SavePath):
os.mkdir(Collect_Picture_SavePath)
try:
#最后面的参数pn代表从pn开始抓取,rn为抓取的图片数量
if len(CurrentPicture_list()) != 0:
start_Collect_Index = int(max(CurrentPicture_list())) + 1
else:
start_Collect_Index = 0
print(‘start_Collect_Index:‘ + str(start_Collect_Index))
Current_Collect_Length = Collect_Picture_length
n = 0
Each_start_Index = start_Collect_Index
for x in range(10000):
print(‘****************‘)
print(‘x:‘ + str(x))
print(‘Each_start_Index:‘+str(Each_start_Index))
相关资源
- python实现SGBM图像匹配算法
- python实现灰度直方图均衡化
- scrapy_qunar_one
- Python学习全系列教程永久可用
- python简明教程.chm
- 抽奖大转盘python的图形化界面
- 双边滤波器实验报告及代码python
- python +MYSQL+HTML实现21蛋糕网上商城
- Python-直播答题助手自动检测出题搜索
- OpenCV入门教程+OpenCV官方教程中文版
- Python 串口工具源码+.exe文件
- Python开发的全栈股票系统.zip
- Python操作Excel表格并将其中部分数据写
- python书籍 PDF
- 利用python绘制散点图
- python+labview+No1.vi
- 老男孩python项目实战
- python源码制作whl文件.rar
- python3.5可用的scipy
- PYTHON3 经典50案例.pptx
- 计算机科学导论-python.pdf
- python模拟鼠标点击屏幕
- windows鼠标自动点击py脚本
- 鱼c小甲鱼零基础学python全套课后题和
- Python 练习题100道
- Practical Programming 2nd Edition
- wxPython Application Development Cookbook
- python 3.6
- Python 3.5.2 中文文档 互联网唯一CHM版本
- python3.5.2.chm官方文档
评论
共有 条评论