• 大小: 5.25MB
    文件类型: .zip
    金币: 1
    下载: 0 次
    发布日期: 2023-09-22
  • 语言: Java
  • 标签: CRF  中文分词  

资源简介

基于CRF++的中文分词,包含了数据、CRF++工具、java源码,可以一键执行

资源截图

代码片段和文件信息

package pku.seg;

import java.io.BufferedReader;
import java.io.InputStreamReader;


public class Command {
public static void exeCmd(String commandStrString flag) {
BufferedReader br = null;
try {
Process p = Runtime.getRuntime().exec(commandStr);
br = new BufferedReader(new InputStreamReader(p.getInputStream()“utf-8“));
String line = null;
StringBuilder sb = new StringBuilder();
while ((line = br.readLine()) != null) {
if(line.length() < 1){
System.out.println(“\n“);
sb.append(“\n“);
continue;
}
if(flag.equalsIgnoreCase(“test“))
sb.append(line + “\n“);
else
System.out.println(line);
}
if(flag.equalsIgnoreCase(“test“)) //测试时输出结果到文件
CRFFormat.write(“data/output.txt“ sb.toString() “utf-8“);
} catch (Exception e) {
e.printStackTrace();

finally
{
if (br != null)
{
try {
br.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
}


public static void main(String[] args) {
// String commandStr = “ping www.luozhipeng.com“;
// Command.exeCmd(commandStr“train“);
}
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2015-07-06 10:31  ML_seg\
     文件         301  2015-06-30 18:56  ML_seg\.classpath
     文件         382  2015-06-14 18:47  ML_seg\.project
     目录           0  2015-07-06 10:31  ML_seg\.settings\
     文件         598  2015-06-14 18:47  ML_seg\.settings\org.eclipse.jdt.core.prefs
     目录           0  2015-07-06 10:31  ML_seg\bin\
     目录           0  2015-07-06 10:31  ML_seg\bin\pku\
     目录           0  2015-07-06 10:31  ML_seg\bin\pku\seg\
     文件        2327  2015-07-06 10:17  ML_seg\bin\pku\seg\Command.class
     文件        2754  2015-07-01 11:27  ML_seg\bin\pku\seg\Crfeval.class
     文件        6845  2015-07-01 11:27  ML_seg\bin\pku\seg\CRFFormat.class
     文件        1994  2015-07-01 11:27  ML_seg\bin\pku\seg\wordSeg.class
     文件       50688  2015-06-14 21:44  ML_seg\crf_learn.exe
     文件       50688  2015-06-14 21:44  ML_seg\crf_test.exe
     目录           0  2015-07-06 10:31  ML_seg\data\
     文件     2050687  2015-06-30 23:54  ML_seg\data\error.txt
     文件     1446134  2015-06-30 23:54  ML_seg\data\output.txt
     文件     1156907  2015-06-30 23:13  ML_seg\data\test_0.data
     文件      310896  2015-06-30 23:13  ML_seg\data\test_sent_0.data
     文件     8867682  2015-06-30 23:14  ML_seg\data\train_0.data
     文件      676852  2015-06-30 23:54  ML_seg\data\罗志鹏-1401210986.seg
     文件      337408  2015-06-14 21:44  ML_seg\libcrfpp.dll
     目录           0  2015-07-06 10:31  ML_seg\src\
     目录           0  2015-07-06 10:31  ML_seg\src\pku\
     目录           0  2015-07-06 10:31  ML_seg\src\pku\seg\
     文件        1166  2015-07-06 10:17  ML_seg\src\pku\seg\Command.java
     文件        1999  2015-06-30 20:40  ML_seg\src\pku\seg\Crfeval.java
     文件        7728  2015-06-30 20:39  ML_seg\src\pku\seg\CRFFormat.java
     文件        1091  2015-06-30 23:13  ML_seg\src\pku\seg\wordSeg.java
     文件         448  2015-06-30 22:31  ML_seg\template
     文件      332564  2015-06-14 19:04  ML_seg\Test_utf16.seg
............此处省略1个文件信息

评论

共有 条评论