资源简介
特征选择DF方法实现源代码
要求要先自行分好词
代码中有详细注释
代码片段和文件信息
package df;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.nio.CharBuffer;
public class DF {
public static void main(String[] args) {
// TODO Auto-generated method stub
int termNum = 1111; //词的数目,也就是没选择前特征数目
String [] terms; //用来记录每个词
String termFile=“KeyWordsDf.txt“; //要求先分好词,存放词的文件,每一行一个词
int [] w ; //用来记录每个词的权重
int k=100; //取权重最高的前K个feature
String termWeighFile=“termWeigh.txt“; //用于保存全部《特征 ,权重》对
String topFeatureFile=“top“ + k + “Feature.txt“; //保存前k个《特征 ,权重》对
String dirName=“F:\\\\ben\\TextCategory\\“; //存放所有语料集的目录地址,如C://
//初始化w
w=new int[termNum];
//把keywords导进来保存在terms数组里面
terms = new String[termNum];
//把语料集全部列出来
File dir = new File(dirName);
File[] files = dir.listFiles();
try {
FileInputStream fis2 = new FileInputStream(termFile);
InputStreamReader isr2 = new InputStreamReader(fis2);
BufferedReader br2 = new BufferedReader(isr2);
for(int i=0;i terms[i] = br2.readLine();
}
br2.close();
isr2.close();
fis2.close();
} catch (Exception e) {
System.out.println(e.getMessage());
}
//使用DF方法进行特征选择
df_count(filestermsw);
//输出《特征,权重》对
try {
FileOutputStream fos = new FileOutputStream(termWeighFile);
OutputStreamWriter osw = new OutputStreamWriter(fos);
BufferedWriter bw = new BufferedWriter(osw);
for(int i=0;i bw.write(terms[i]+“ “);
bw.write(String.valueOf(w[i]));
bw.newLine();
}
bw.close();
osw.close();
fos.close();
} catch (Exception e) {
System.out.println(e.getMessage());
}
//对《特征,权重》进行排序
top_feature(ter
- 上一篇:android多点触控 两指缩放的demo
- 下一篇:zookeeper的相关介绍
相关资源
- 《剑指Offer》Java代码带目录.pdf
- 高效敏感词过滤JAVA实现DFA算法 5000字
- 新闻发布系统JSP+ACCESS ,源代码+详细
- JSP开发邮件系统(源代码)
- java 使用jacob Word转PDF 完美格式
- Mongodb + GridFS +Java 操作Mongodb中存储的
- 广工java文本编辑器课设源代码
- 在线投票小程序java源代码
- 基于JAVA的学生管理系统源代码
- 排课表Java源代码
- 基于java的多线程断点续传程序源代码
- cmpp2.0 java源代码
- 完整都的java聚类算法包括界面
- java 微信版飞机大战完整的图片资源和
- 回溯法解决旅行售货员问题源代码j
- Java+固定资产管理系统课程设计源代码
- 银行排队模拟程序 Java课程设计 源代
- 商品库存管理系统java源代码
- 图书馆管理系统jsp+mysql+Servlet+javaBea
- Android开发RPG魔塔游戏源代码
- 在线考试系统完整代码,JAVA源码
- java版本坦克大战源代码
- C/S结构的java聊天室源代码
- 简单的android闹钟源代码.zip
- 图书管理系统源代码(java实现.docx
- 2019年Java题库学生版.pdf
- Android连连看游戏源代码集锦
- android-9-cdd.pdf
- Android外文翻译.pdf
- RSA加解密算法java源代码
评论
共有 条评论