• 大小: 4.64M
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2024-06-16
  • 语言: C#
  • 标签: OCR  pdf  MOD  调用  OCR  C#  

资源简介

微软ocr MODI OCR调用识别,合成双层pdf

资源截图

代码片段和文件信息

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Windows.Forms;
using MODI;
using System.Runtime.Serialization.Json;
using System.IO;
using Newtonsoft.Json;
//using iTextSharp.text.pdf;
//using iTextSharp.text;
using O2S.Components.PDF4NET;
using O2S.Components.PDF4NET.PDFFile;
using O2S.Components.PDF4NET.Graphics;
using O2S.Components.PDF4NET.Graphics.Fonts;
using O2S.Components.PDF4NET.Graphics.ColorSpaces;

namespace MODIOCR
{
    public partial class Form1 : Form
    {
        public Form1()
        {
            InitializeComponent();
        }

        public class ImageInfo
        {
            public int Sort { get; set; }
            public string ImagePath { get; set; }
            public double With { get; set; }
            public double Height { get; set; }
            public List WordPositions { get; set; }
        }
        public class WordPosition
        {
            public string Text { get; set; }
            public int X { get; set; }
            public int Y { get; set; }

            public short? FontSize { get; set; }
        }
        private void button1_Click(object sender EventArgs e)
        {

            string[] filenames = Directory.GetFiles(textBox1.Text);
            Array.Sort(filenames);


            List imageInfos = GetImageInfos(filenames);

            PDFOut(imageInfos txt_savepath.Text);


        }

        private List GetImageInfos(string[] filenames)
        {
            MODI.Document document;
            int pageNum = 0;
            string pageImagePath = null;
            try
            {
                List imageInfos = new List();
                foreach (var item in filenames)
                {
                    pageNum++;
                    pageImagePath = item;

                    var imgInfo = new ImageInfo();

                    document = new MODI.Document();
                    document.Create(item);
                    document.OCR(MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED false false);
                    MODI.Image image = (MODI.Image)document.Images[0];
                    MODI.Layout layout = image.Layout;
                    imgInfo.Sort = pageNum;
                    imgInfo.ImagePath = item;
                    imgInfo.Height = image.PixelHeight;
                    imgInfo.With = image.PixelWidth;
                    imgInfo.WordPositions = new List();
                    StringBuilder sb = new StringBuilder();
                    foreach (MODI.Word w in layout.Words)
                    {

                        MiRects rects = w.Rects;
                        if (rects.Count > 0)
                        {
                            foreach (IMiRect mclass in rects)
                   

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件         863  2021-08-04 20:17  MODIOCR.sln
     文件       45056  2021-08-08 09:25  MODIOCR.suo
     目录           0  2021-08-07 12:03  MODIOCR\
     目录           0  2021-08-04 20:17  MODIOCR\bin\
     目录           0  2021-08-07 21:36  MODIOCR\bin\Debug\
     文件       19968  2021-08-08 10:34  MODIOCR\bin\Debug\MODIOCR.exe
     文件       28160  2021-08-08 10:34  MODIOCR\bin\Debug\MODIOCR.pdb
     文件       11600  2021-08-08 11:00  MODIOCR\bin\Debug\MODIOCR.vshost.exe
     文件         490  2019-12-07 17:10  MODIOCR\bin\Debug\MODIOCR.vshost.exe.manifest
     文件      491008  2021-08-06 11:10  MODIOCR\bin\Debug\Newtonsoft.Json.dll
     文件     2180608  2021-08-07 12:03  MODIOCR\bin\Debug\O2S.Components.PDF4NET.dll
     文件      966656  2021-08-07 08:59  MODIOCR\bin\Debug\O2S.Components.PDFRender4NET.dll
     文件       11387  2021-08-08 11:00  MODIOCR\Form1.cs
     文件        3122  2021-08-08 09:25  MODIOCR\Form1.Designer.cs
     文件        5817  2021-08-08 09:25  MODIOCR\Form1.resx
     文件     4059136  2021-08-06 14:32  MODIOCR\itextsharp.dll
     文件        5030  2021-08-07 21:36  MODIOCR\MODIOCR.csproj
     文件       10752  2021-08-06 14:48  MODIOCR\MODIOCR.suo
     文件      491008  2021-08-06 11:10  MODIOCR\Newtonsoft.Json.dll
     文件     2180608  2021-08-07 12:03  MODIOCR\O2S.Components.PDF4NET.dll
     文件      966656  2021-08-07 08:59  MODIOCR\O2S.Components.PDFRender4NET.dll
     目录           0  2021-08-04 20:17  MODIOCR\obj\
     目录           0  2021-08-04 20:17  MODIOCR\obj\x86\
     目录           0  2021-08-08 10:34  MODIOCR\obj\x86\Debug\
     文件        5420  2021-08-07 21:54  MODIOCR\obj\x86\Debug\DesignTimeResolveAssemblyReferences.cache
     文件        6821  2021-08-08 10:34  MODIOCR\obj\x86\Debug\DesignTimeResolveAssemblyReferencesInput.cache
     文件       33280  2021-08-04 20:21  MODIOCR\obj\x86\Debug\Interop.MODI.dll
     文件        1459  2021-08-08 11:00  MODIOCR\obj\x86\Debug\MODIOCR.csproj.FileListAbsolute.txt
     文件         975  2021-08-08 09:26  MODIOCR\obj\x86\Debug\MODIOCR.csproj.GenerateResource.Cache
     文件         777  2021-08-04 20:21  MODIOCR\obj\x86\Debug\MODIOCR.csproj.ResolveComReference.cache
     文件       35562  2021-08-07 18:45  MODIOCR\obj\x86\Debug\MODIOCR.csprojResolveAssemblyReference.cache
............此处省略12个文件信息

评论

共有 条评论