• 大小: 2.5MB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2023-11-10
  • 语言: Html/CSS
  • 标签: poi  word  html  

资源简介

poi将word里面的内容转换成html、包括word里面字体的大小、表格的处理、还有图片、段落等等...

资源截图

代码片段和文件信息

package net.sunflower.demo;
import java.io.BufferedWriter;  
import java.io.File;  
import java.io.FileInputStream;  
import java.io.FileNotFoundException;  
import java.io.FileOutputStream;  
import java.io.IOException;  
import java.io.OutputStream;  
import java.io.OutputStreamWriter;  
  
import org.apache.poi.hwpf.HWPFDocument;  
import org.apache.poi.hwpf.model.PicturesTable;  
import org.apache.poi.hwpf.usermodel.CharacterRun;  
import org.apache.poi.hwpf.usermodel.Picture;  
import org.apache.poi.hwpf.usermodel.Range;  
import org.apache.poi.hwpf.usermodel.Paragraph;     
import org.apache.poi.hwpf.usermodel.Table;     
import org.apache.poi.hwpf.usermodel.TableCell;     
import org.apache.poi.hwpf.usermodel.TableIterator;     
import org.apache.poi.hwpf.usermodel.TableRow;     
  
  
public class WordtoHtml {  
  
    /** 
     * 回车符ASCII码 
     */  
    private static final short ENTER_ASCII = 13;  
  
    /** 
     * 空格符ASCII码 
     */  
    private static final short SPACE_ASCII = 32;  
  
    /** 
     * 水平制表符ASCII码 
     */  
    private static final short TABULATION_ASCII = 9;  
  
    public static String htmlText = ““;  
    public static String htmlTextTbl = ““;  
    public static int counter=0;  
    public static int beginPosi=0;  
    public static int endPosi=0;  
    public static int beginArray[];  
    public static int endArray[];  
    public static String htmlTextArray[];  
    public static boolean tblExist=false;  
      
    public static void main(String argv[])  
    {         
        try {  
         getWordAndstyle(“D://kexie/读取科协.doc“);
        } catch (Exception e) {  
            e.printStackTrace();  
        }  
    }  
      
    /** 
     * 读取每个文字样式 
     *  
     * @param fileName 
     * @throws Exception 
     */  
  
      
    public static void getWordAndstyle(String fileName) throws Exception {  
        FileInputStream in = new FileInputStream(new File(fileName));  
        HWPFDocument doc = new HWPFDocument(in);  
          
         Range rangetbl = doc.getRange();//得到文档的读取范围     
         TableIterator it = new TableIterator(rangetbl);   
         int num=100;          
          
           
         beginArray=new int[num];  
         endArray=new int[num];  
         htmlTextArray=new String[num];  
        // 取得文档中字符的总数  
        int length = doc.characterLength();  
        // 创建图片容器  
        PicturesTable pTable = doc.getPicturesTable();  
          
        htmlText = “tle>“ + doc.getSummaryInformation().gettitle() + “tle>“;  
        // 创建临时字符串好加以判断一串字符是否存在相同格式  
          
         if(it.hasNext())  
         {  
             readTable(itrangetbl);  
         }  
           
         int cur=0;  
              
        String tempString = ““;  
        for (int i = 0; i < length - 1; i++) {  
            // 整篇文章的字符通过一个个字符的来判断range为得到文档的范围  
            

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件    1760031  2011-10-25 20:19  poi将word转换成html\poi-3.8-beta4-20110826.jar

     文件    1129968  2011-10-25 20:19  poi将word转换成html\poi-scratchpad-3.8-beta4-20110826.jar

     文件      10342  2013-03-04 10:19  poi将word转换成html\WordtoHtml.java

     目录          0  2013-03-04 10:21  poi将word转换成html

----------- ---------  ---------- -----  ----

              2900341                    4


评论

共有 条评论