• 大小: 47.31M
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-01-29
  • 语言: C/C++
  • 标签: OCR  Tesseract  

资源简介

VS2010调用tesseract步骤

先说明一下,我的tesseract安装路径为D:\Tesseract-OCR如果你安装路径和我不一样,将这份文档里所有D:\Tesseract-OCR改为安装路径即可。

点击下载文件

 

查了下资料VS2012的调用方法和2010类似,可以试一下,出了问题再说

1. 下载libdll(所有需要下载的东西附件里下载)

Ø 首先安装tesseract-ocr-setup-3.02.02.exe文件,我的安装路径为D:\Tesseract-OCR;

Ø 安装完成后解压tesseract-3.02.02-win32-lib-include-dirs.zip文件,将里面的libinclude文件夹复制到Tesseract-OCR目录下;

Ø 最后解压缩  liblept168VS2010编译出的libtesseract302.rar  文件,将该压缩文件里的三个dll文件复制到Tesseract-OCR\lib目录下,替换该目录下的文档

(原因目录下被替换的文档时在VS2008平台下编译生成的,替换的文档则是VS2010平台下生成的,这个事从网上直接找的)

Ø 将chi_sim.traineddata.gz解压缩然后chi_sim.traineddata复制D:\Tesseract-OCR\tessdata下,这已经有的简体中文训练集

2. 检查并修改环境变量

一般情况下环境安装tesseract后环境变量就自动配置好了,但是为了确保后面不出错,最好还是检查一下,在环境变量Path中增加指向安装目录下lib的路径,比如D: \Tesseract-OCR\lib  ,以便exe运行时能找到所需要的dll

Ø 还有一步特别重要,就是一定要查看环境变量TESSDATA_PREFIX,将其路径改到D:\Tesseract-OCR\下。

3. 新建一个C 工程,我的是一个空的win3程序。好后新建一个CPP文件,添加这几行代码:

#include "strngs.h"  

#include "baseapi.h"

#include <iostream>

using namespace std;

#pragma  comment(lib,"libtesseract302d.lib")

然后需要添加包含的目录,如下:(我新建工程为test

(1) 在工程(不是解决方案)上单击右键选择属性依次单击配置属性——C/C ——常规,在右侧找到附加包含目录,该目录下添加D: \Tesseract-OCR\include\tesseract;

(2) 配置属性——链接器——常规找到附加库目录添加D: \Tesseract-OCR\lib

4、在前面新建的CPP加入如下代码:

int main()

{

char * str = "D:\\0_1326268060c8r8.gif";  //这是要识别图像的绝对路径

tesseract::TessBaseAPI  api;    

api.Init(NULL, "chi_sim", tesseract::OEM_DEFAULT);  //初始化,设置语言包,中文简体:chi_sim;英文:eng;也可以自己训练语言包  

STRING text_out;   //定义输出的变量

if (!api.ProcessPages(str, NULL, 0, &text_out))    

{    

return 0;    

}

cout<<text_out.string();  //输出命令行

}

然后运行文件,可以发现将识别出的文字显示在了命令行中。

资源截图

代码片段和文件信息

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件   19732398  2015-10-19 11:04  tesseract_ocr资料\chi_sim.traineddata.gz

     文件   13524653  2015-10-30 15:49  tesseract_ocr资料\tesseract-ocr-setup-3.02.02.rar

     文件   16341676  2015-10-30 15:46  tesseract_ocr资料\tesseract_ocr include&lib vs2010下.rar

     文件      18140  2015-10-29 14:32  tesseract_ocr资料\VS2010调用tesseract-OCR_API步骤.docx

     目录          0  2015-10-30 15:49  tesseract_ocr资料

----------- ---------  ---------- -----  ----

             49616867                    5


评论

共有 条评论