资源简介

python高概率OCR图像识别案例,python使用tesseract和PIL模块提高图片和文字转化的概率,通过此案例得到的ocr程序脚本识别概率达90%以上!

资源截图

代码片段和文件信息

# -*- coding: utf-8 -*-
import sys

reload(sys)
sys.setdefaultencoding(‘utf-8‘)


import os
os.environ[‘NLS_LANG‘] = ‘SIMPLIFIED CHINESE_CHINA.UTF8‘

#检查OCR库和工具
try:
    from pyocr import pyocr
    from PIL import Image
    from PIL import ImageEnhance
except ImportError:
    print ‘模块导入错误请使用pip安装pytesseract依赖以下库:‘
    print ‘http://www.lfd.uci.edu/~gohlke/pythonlibs/#pil‘
    print ‘http://code.google.com/p/tesseract-ocr/‘
    raise SystemExit
tools = pyocr.get_available_tools()[:]
if len(tools) == 0:
    print(“No OCR tool found“)
    sys.exit(1)


#裁剪图片
FOLDER = “.\saved\\“ #处理后的图片文件夹
FIN_IMAGE = ‘x.png‘ #处理后的图片文件名
_CONTENT_TYPES = {‘image/png‘: ‘.png‘ ‘image/gif‘: ‘.gif‘ ‘image/jpeg‘: ‘.jpg‘ ‘image/jpeg‘: ‘.jpeg‘}

FIN_IMAGE_PATH = FOLDER + FIN_IMAGE

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件        1837  2017-01-09 14:09  imgcrop.py
     目录           0  2017-01-11 14:23  saved\
     文件       28544  2017-01-09 12:00  test.png
     文件       47213  2017-01-09 14:41  Python图像识别.docx

评论

共有 条评论