资源简介
基于CRF++的中文分词,包含了数据、CRF++工具、java源码,可以一键执行
代码片段和文件信息
package pku.seg;
import java.io.BufferedReader;
import java.io.InputStreamReader;
public class Command {
public static void exeCmd(String commandStrString flag) {
BufferedReader br = null;
try {
Process p = Runtime.getRuntime().exec(commandStr);
br = new BufferedReader(new InputStreamReader(p.getInputStream()“utf-8“));
String line = null;
StringBuilder sb = new StringBuilder();
while ((line = br.readLine()) != null) {
if(line.length() < 1){
System.out.println(“\n“);
sb.append(“\n“);
continue;
}
if(flag.equalsIgnoreCase(“test“))
sb.append(line + “\n“);
else
System.out.println(line);
}
if(flag.equalsIgnoreCase(“test“)) //测试时输出结果到文件
CRFFormat.write(“data/output.txt“ sb.toString() “utf-8“);
} catch (Exception e) {
e.printStackTrace();
}
finally
{
if (br != null)
{
try {
br.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
}
public static void main(String[] args) {
// String commandStr = “ping www.luozhipeng.com“;
// Command.exeCmd(commandStr“train“);
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2015-07-06 10:31 ML_seg\
文件 301 2015-06-30 18:56 ML_seg\.classpath
文件 382 2015-06-14 18:47 ML_seg\.project
目录 0 2015-07-06 10:31 ML_seg\.settings\
文件 598 2015-06-14 18:47 ML_seg\.settings\org.eclipse.jdt.core.prefs
目录 0 2015-07-06 10:31 ML_seg\bin\
目录 0 2015-07-06 10:31 ML_seg\bin\pku\
目录 0 2015-07-06 10:31 ML_seg\bin\pku\seg\
文件 2327 2015-07-06 10:17 ML_seg\bin\pku\seg\Command.class
文件 2754 2015-07-01 11:27 ML_seg\bin\pku\seg\Crfeval.class
文件 6845 2015-07-01 11:27 ML_seg\bin\pku\seg\CRFFormat.class
文件 1994 2015-07-01 11:27 ML_seg\bin\pku\seg\wordSeg.class
文件 50688 2015-06-14 21:44 ML_seg\crf_learn.exe
文件 50688 2015-06-14 21:44 ML_seg\crf_test.exe
目录 0 2015-07-06 10:31 ML_seg\data\
文件 2050687 2015-06-30 23:54 ML_seg\data\error.txt
文件 1446134 2015-06-30 23:54 ML_seg\data\output.txt
文件 1156907 2015-06-30 23:13 ML_seg\data\test_0.data
文件 310896 2015-06-30 23:13 ML_seg\data\test_sent_0.data
文件 8867682 2015-06-30 23:14 ML_seg\data\train_0.data
文件 676852 2015-06-30 23:54 ML_seg\data\罗志鹏-1401210986.seg
文件 337408 2015-06-14 21:44 ML_seg\libcrfpp.dll
目录 0 2015-07-06 10:31 ML_seg\src\
目录 0 2015-07-06 10:31 ML_seg\src\pku\
目录 0 2015-07-06 10:31 ML_seg\src\pku\seg\
文件 1166 2015-07-06 10:17 ML_seg\src\pku\seg\Command.java
文件 1999 2015-06-30 20:40 ML_seg\src\pku\seg\Crfeval.java
文件 7728 2015-06-30 20:39 ML_seg\src\pku\seg\CRFFormat.java
文件 1091 2015-06-30 23:13 ML_seg\src\pku\seg\wordSeg.java
文件 448 2015-06-30 22:31 ML_seg\template
文件 332564 2015-06-14 19:04 ML_seg\Test_utf16.seg
............此处省略1个文件信息
相关资源
- IKAnalyzer2012_u6中文分词器jar包
- 条件随机场(CRF)的Java源代码实现最
- IKAnalyzer中文分词器jar包
- 中文分词库 IKAnalyzer For Lucene 5.2.1适用
- IK分词器完整资源包 有配置文件和j
- 中文分词与关键词提取NLPIR java版
- java 实现的中文分词算法代码
- Java中文分词
- lucene检索代码,自己总结的非常详细
- Java中文分词生成词云GUI
- 贝叶斯分类实现垃圾信息分类支持中
- solr4的IK中文分词器IKAnalyzer2012FF_u1.j
- FMM前向最大分词技术
- Spark大数据中文分词统计Java工程源码
- CRF+词典方法的中文命名实体识别工具
- IK_CAnalyzer.jar
- JAVA实现的中文分词程序
- Yard中文分词系统V0.1.1版
评论
共有 条评论