资源简介
(一)python爬虫验证码识别(去除干扰线)https://blog.csdn.net/weixin_40267472/article/details/81384624
代码片段和文件信息
#-*-coding:utf-8 -*-
from __future__ import division
import cv2
import math
from pytesser import *
import os
import re
def del_noise(im_cut):
‘‘‘ variable:bins:灰度直方图bin的数目
num_gray:像素间隔
method:1.找到灰度直方图中像素第二多所对应的像素,即second_max因为图像空白处比较多所以第一多的应该是空白,第二多的才是我们想要的内容。
2.计算mode
3.除了在mode+-一定范围内的,全部变为空白。
‘‘‘
bins = 16
num_gray = math.ceil(256 / bins)
hist = cv2.calcHist([im_cut] [0] None [bins] [0 256])
lists = []
for i in range(len(hist)):
# print hist[i][0]
lists.append(hist[i][0])
second_max = sorted(lists)[-2]
bins_second_max = lists.index(second_max)
mode = (bins_second_max + 0.5) * num_gray
for i in range(len(im_cut)):
for j in range(len(im_cut[0])):
if im_cut[i][j] < mode - 15 or im_cut[i][j] > mode + 15:
# print im_cut[i][j]
im_cut[i][j] = 255
return im_cut
def cut_image(image num img_name):
# image = cv2.imread(‘./img/8.jpg‘)
im = cv2.cvtColor(image cv2.COLOR_BGR2GRAY)
# im_cut_real = im[8:47 28:128]
im_cut_1 = im[8:47 27:52]
im_cut_2 = im[8:47 52:77]
im_cut_3 = im[8:47 77:102]
im_cut_4 = im[8:47 102:127]
im_cut = [im_cut_1 im_cut_2 im_cut_3 im_cut_4]
for i in range(4):
im_temp = del_noise(im_cut[i])
cv2.imwrite(‘./img_train_cut/‘+str(num)+ ‘_‘ + str(i)+‘_‘+img_name[i]+‘.jpg‘ im_temp)
if __name__ == ‘__main__‘:
img_dir = ‘./img‘
img_name = os.listdir(img_dir) # 列出文件夹下所有的目录与文件
for i in range(len(img_name)):
path = os.path.join(img_dir img_name[i])
image = cv2.imread(path)
name_list = list(img_name[i])[:4]
# name = ‘‘.join(name_list)
cut_image(image i name_list)
print ‘图片%s分割完成‘ % (i)
print u‘*****图片分割预处理完成!*****‘
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 2174 2018-08-02 15:06 cut_image.py
文件 610 2018-09-20 23:49 download_img.py
文件 4361 2018-08-01 15:32 img\0024.jpg
文件 4366 2018-08-01 16:10 img\0027.jpg
文件 4560 2018-08-01 16:10 img\0059.jpg
文件 4479 2018-08-01 16:10 img\0066.jpg
文件 4539 2018-08-01 16:10 img\0074.jpg
文件 4296 2018-08-02 14:17 img\0084.jpg
文件 4420 2018-08-01 16:10 img\0102.jpg
文件 4689 2018-08-01 16:10 img\0107.jpg
文件 4426 2018-08-01 16:10 img\0110.jpg
文件 4242 2018-08-01 15:33 img\0112.jpg
文件 4271 2018-08-01 16:10 img\0127.jpg
文件 4156 2018-08-01 15:33 img\0129.jpg
文件 4315 2018-08-01 16:10 img\0138.jpg
文件 4538 2018-08-01 16:10 img\0141.jpg
文件 4380 2018-08-01 16:11 img\0152.jpg
文件 4714 2018-08-01 16:10 img\0163.jpg
文件 3967 2018-08-01 16:10 img\0165.jpg
文件 4164 2018-08-01 16:10 img\0179.jpg
文件 3876 2018-08-01 16:10 img\0180.jpg
文件 4130 2018-08-01 16:10 img\0193.jpg
文件 4191 2018-08-01 16:10 img\0197.jpg
文件 4602 2018-08-01 16:10 img\0199.jpg
文件 4130 2018-08-01 16:10 img\0205.jpg
文件 4484 2018-08-01 16:10 img\0207.jpg
文件 4156 2018-08-01 16:10 img\0218.jpg
文件 4390 2018-08-01 16:10 img\0222.jpg
文件 4723 2018-08-01 16:10 img\0227.jpg
文件 4537 2018-08-01 16:10 img\0239.jpg
文件 4530 2018-08-01 16:11 img\0247.jpg
............此处省略6478个文件信息
- 上一篇:Python-西瓜视频百万英雄答题助手
- 下一篇:python专利爬虫
相关资源
- 双边滤波器实验报告及代码python
- opencv+Python的教程大全
- 《机器学习-使用OpenCV和Python进行智能
- OpenCV图像处理总结
- 图像处理的详细python程序
- 利用脉冲耦合神经网络的图像处理.
- 字符型图片数字验证码识别完整过程
- tif遥感数据.zip
- 图像处理-图片找不同Find the differenc
- OpenCV-Python中文教程
- tensorflow-1.9.0-cp37-cp37m-win_amd64.whl
- 机器学习实验报告,验证码识别,代
- Python实现跟踪、光流、前景检测
- 计算机/数字图像处理专业本科毕设—
- opencv3机器视觉python语言实现.zip
- PCI Geomatica 遥感图像处理软件 使用教
- OpenCV 3计算机视觉:Python语言实现——
- python图像处理相机姿态估计
- 机器学习-使用OpenCV和Python进行智能图
- python实现两张图片融合
- ALL_demos.rar贾老师python-OpenCV源码
- 批量图片随机裁剪,翻转,颠倒--图片
- 基于python爬取验证码并识别
- python 实现图片像素大小设置
- 图片的旋转方法算法以及双线性插值
- 区域生长 python版 dicom图像
- 基于GDAL的Python实现遥感影像PCA的代码
- python图像处理三维重建所有代码
- Python 产生任意形状的封闭图形,并将
- 《OpenCV视觉之眼》专栏图像处理总体
评论
共有 条评论