资源简介
poi将word里面的内容转换成html、包括word里面字体的大小、表格的处理、还有图片、段落等等...
代码片段和文件信息
package net.sunflower.demo;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.io.OutputStreamWriter;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.model.PicturesTable;
import org.apache.poi.hwpf.usermodel.CharacterRun;
import org.apache.poi.hwpf.usermodel.Picture;
import org.apache.poi.hwpf.usermodel.Range;
import org.apache.poi.hwpf.usermodel.Paragraph;
import org.apache.poi.hwpf.usermodel.Table;
import org.apache.poi.hwpf.usermodel.TableCell;
import org.apache.poi.hwpf.usermodel.TableIterator;
import org.apache.poi.hwpf.usermodel.TableRow;
public class WordtoHtml {
/**
* 回车符ASCII码
*/
private static final short ENTER_ASCII = 13;
/**
* 空格符ASCII码
*/
private static final short SPACE_ASCII = 32;
/**
* 水平制表符ASCII码
*/
private static final short TABULATION_ASCII = 9;
public static String htmlText = ““;
public static String htmlTextTbl = ““;
public static int counter=0;
public static int beginPosi=0;
public static int endPosi=0;
public static int beginArray[];
public static int endArray[];
public static String htmlTextArray[];
public static boolean tblExist=false;
public static void main(String argv[])
{
try {
getWordAndstyle(“D://kexie/读取科协.doc“);
} catch (Exception e) {
e.printStackTrace();
}
}
/**
* 读取每个文字样式
*
* @param fileName
* @throws Exception
*/
public static void getWordAndstyle(String fileName) throws Exception {
FileInputStream in = new FileInputStream(new File(fileName));
HWPFDocument doc = new HWPFDocument(in);
Range rangetbl = doc.getRange();//得到文档的读取范围
TableIterator it = new TableIterator(rangetbl);
int num=100;
beginArray=new int[num];
endArray=new int[num];
htmlTextArray=new String[num];
// 取得文档中字符的总数
int length = doc.characterLength();
// 创建图片容器
PicturesTable pTable = doc.getPicturesTable();
htmlText = “tle>“ + doc.getSummaryInformation().gettitle() + “ tle>“;
// 创建临时字符串好加以判断一串字符是否存在相同格式
if(it.hasNext())
{
readTable(itrangetbl);
}
int cur=0;
String tempString = ““;
for (int i = 0; i < length - 1; i++) {
// 整篇文章的字符通过一个个字符的来判断range为得到文档的范围
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 1760031 2011-10-25 20:19 poi将word转换成html\poi-3.8-beta4-20110826.jar
文件 1129968 2011-10-25 20:19 poi将word转换成html\poi-scratchpad-3.8-beta4-20110826.jar
文件 10342 2013-03-04 10:19 poi将word转换成html\WordtoHtml.java
目录 0 2013-03-04 10:21 poi将word转换成html
----------- --------- ---------- ----- ----
2900341 4
相关资源
- html5 水平时间轴设计
- html5 svg点击图片全屏动画展开图片文
- html5带歌词的音乐播放器代码
- js HTML5 实现网页版植物大战僵尸游戏
- HTML+CSS仿东南大学网站首页.zip
- html+css+js表白源码.rar
- MDUI文件+教程
-
《HTML+CSS+ja
vasc ript实用详解》随书 - html动漫网页设计模板
- 关于城市旅游的HTML网页设计-----北京
- 淘宝页面最新版HTML+CSS.zip
- 登录注册界面HTML
- html+css制作小米官网
- LOL官网.zip
- Html课程设计
- 个人博客.zip
- html+js登录页面设计
- HTML5 个人简历模板
- 装修公司网站HTML前端源码
- 小说网站开发 html js 静态网站开发项
- HTML5游戏《魔法纸牌》源码
- bootstrap交易平台响应网站模板_html5交
- 静态页面 前台静态页面 html语言的
- 实用的网站后台设计的HTML(共27个)
- 基于html5、JS实现的拍照上传图片
- web html爱情 表白
- themefrest admin html后台模板
- HTML表白代码 电子相册+背景音乐
- 网页HTML转EXE工具汉化版
- DIHtmlParser 7.6.1 FS (D4-XE8)
评论
共有 条评论