资源简介
基于贝叶斯及KNN算法的newsgroup文本分类器,eclipse工程
程序运行方法:用eclipse打开工程,并将newsgroup文档集解压到
F:\DataMiningSample\orginSample目录下,同时在F:\DataMiningSample\
下建好如附件“F盘DataMiningSample目录下的数据子目录结构”图中的目录,
停用词表也放在"F:/DataMiningSample/目录下,即可运行eclipse工程。程序
会依次执行数据预处理、贝叶斯分类、KNN分类,输出10次交叉验证实验的分类
结果、准确率统计及混淆矩阵。

代码片段和文件信息
package com.pku.yangliu;
/**分类器主分类,依次执行数据预处理、朴素贝叶斯分类、KNN分类
* @author yangliu
* @qq 772330184
* @mail yang.liu@pku.edu.cn
*
*/
public class ClassifierMain {
public static void main(String[] args) throws Exception {
// TODO Auto-generated method stub
DataPreProcess DataPP = new DataPreProcess();
NaiveBayesianClassifier nbClassifier = new NaiveBayesianClassifier();
KNNClassifier knnClassifier = new KNNClassifier();
DataPP.BPPMain(args);
nbClassifier.NaiveBayesianClassifierMain(args);
knnClassifier.KNNClassifierMain(args);
}
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 128996 2012-03-26 01:04 F盘DataMiningSample目录下的数据子目录结构.jpg
文件 367 2012-03-27 23:14 readme.txt
文件 3770 2012-03-07 14:30 stopwords.txt
文件 301 2012-03-06 19:41 DataMiningClassify\.classpath
文件 394 2012-03-06 19:41 DataMiningClassify\.project
文件 629 2012-03-06 19:41 DataMiningClassify\.settings\org.eclipse.jdt.core.prefs
文件 932 2012-03-26 00:41 DataMiningClassify\bin\com\pku\yangliu\ClassifierMain.class
文件 8525 2012-03-26 00:09 DataMiningClassify\bin\com\pku\yangliu\ComputeWordsVector.class
文件 4393 2012-03-26 00:08 DataMiningClassify\bin\com\pku\yangliu\CreateTrainAndTestSample.class
文件 4429 2012-03-26 01:16 DataMiningClassify\bin\com\pku\yangliu\DataPreProcess.class
文件 1442 2012-03-26 00:15 DataMiningClassify\bin\com\pku\yangliu\KNNClassifier$ByValueComparator.class
文件 11114 2012-03-26 00:15 DataMiningClassify\bin\com\pku\yangliu\KNNClassifier.class
文件 11271 2012-03-26 00:41 DataMiningClassify\bin\com\pku\yangliu\NaiveBayesianClassifier.class
文件 7622 2012-03-23 00:50 DataMiningClassify\bin\com\pku\yangliu\Stemmer.class
文件 600 2012-03-26 00:40 DataMiningClassify\src\com\pku\yangliu\ClassifierMain.java
文件 7758 2012-03-26 00:09 DataMiningClassify\src\com\pku\yangliu\ComputeWordsVector.java
文件 3616 2012-03-26 00:01 DataMiningClassify\src\com\pku\yangliu\CreateTrainAndTestSample.java
文件 4397 2012-03-26 01:16 DataMiningClassify\src\com\pku\yangliu\DataPreProcess.java
文件 11983 2012-03-26 00:15 DataMiningClassify\src\com\pku\yangliu\KNNClassifier.java
文件 11489 2012-03-26 00:41 DataMiningClassify\src\com\pku\yangliu\NaiveBayesianClassifier.java
文件 14649 2012-03-07 20:25 DataMiningClassify\src\com\pku\yangliu\PorterAlgorithm.java
目录 0 2012-03-26 01:25 DataMiningClassify\bin\com\pku\yangliu
目录 0 2012-03-26 01:25 DataMiningClassify\src\com\pku\yangliu
目录 0 2012-03-26 01:25 DataMiningClassify\bin\com\pku
目录 0 2012-03-26 01:25 DataMiningClassify\src\com\pku
目录 0 2012-03-26 01:25 DataMiningClassify\bin\com
目录 0 2012-03-26 01:25 DataMiningClassify\src\com
目录 0 2012-03-26 01:25 DataMiningClassify\.settings
目录 0 2012-03-26 01:25 DataMiningClassify\bin
目录 0 2012-03-26 01:25 DataMiningClassify\src
............此处省略4个文件信息
- 上一篇:fpga串口通信,利用fifo转发
- 下一篇:QT5在ARM 平台的移植过程
相关资源
- 数据挖掘(重心法迭代.xlsx)
- FEATURE SELECTION FOR KNOWLEDGE DISCOVERY AND
- eServer z 系列服务器数据挖掘解决方案
- Cluster Ensembles – A Knowledge Reuse fr
- RiotFileTranslator2.0b(maya插件,可支持
- 基于粗糙集神经网络的数据挖掘在门
- 常用数据挖掘数据集
- 93年-2006年全国各地级市、县的GDP
- 粗糙集算法论文
- 国科大数据挖掘大作业2018交通拥堵预
- WEKA arff 实验数据集---数据挖掘用
- 数据挖掘18大算法实现以及其他相关经
- 基于决策树和朴素贝叶斯算法对Adul
- 哈尔滨工业大学深圳 数据挖掘 2017 考
- 机器学习方法R实现-用决策树、神经网
- 七月学习--数据挖掘基础
- 轨迹数据挖掘各种行为
- 数据挖掘导论完整版PPT及课后习题答
- 数据挖掘在各行业的应用论文
- darknet——yolov3
- decisiontree决策树在adult数据集上的实现
- knime的
- 用各种机器学习方法knn,随机森林,
- KNIME教程加demo
- 基于数据挖掘技术的液压泵的故障诊
- 基于数据挖掘技术的掘进机工况监测
- 30000kN液压支架试验台自动调高液压系
- 国科大数据挖掘期末考试试题
- 基于DBAN的监控视频数据挖掘
- 1.5m中心距8000kN两柱掩护式液压支架设
评论
共有 条评论