• 大小: 143KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-05-16
  • 语言: 其他
  • 标签: 数据挖掘  KNN算法  

资源简介

基于贝叶斯及KNN算法的newsgroup文本分类器,eclipse工程 程序运行方法:用eclipse打开工程,并将newsgroup文档集解压到 F:\DataMiningSample\orginSample目录下,同时在F:\DataMiningSample\ 下建好如附件“F盘DataMiningSample目录下的数据子目录结构”图中的目录, 停用词表也放在"F:/DataMiningSample/目录下,即可运行eclipse工程。程序 会依次执行数据预处理、贝叶斯分类、KNN分类,输出10次交叉验证实验的分类 结果、准确率统计及混淆矩阵。

资源截图

代码片段和文件信息

package com.pku.yangliu;

/**分类器主分类,依次执行数据预处理、朴素贝叶斯分类、KNN分类
 * @author yangliu
 * @qq 772330184 
 * @mail yang.liu@pku.edu.cn
 *
 */
public class ClassifierMain {

public static void main(String[] args) throws Exception {
// TODO Auto-generated method stub
DataPreProcess DataPP = new DataPreProcess();
NaiveBayesianClassifier nbClassifier = new NaiveBayesianClassifier();
KNNClassifier knnClassifier = new KNNClassifier();
DataPP.BPPMain(args);
nbClassifier.NaiveBayesianClassifierMain(args);
knnClassifier.KNNClassifierMain(args);
}
}

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件     128996  2012-03-26 01:04  F盘DataMiningSample目录下的数据子目录结构.jpg

     文件        367  2012-03-27 23:14  readme.txt

     文件       3770  2012-03-07 14:30  stopwords.txt

     文件        301  2012-03-06 19:41  DataMiningClassify\.classpath

     文件        394  2012-03-06 19:41  DataMiningClassify\.project

     文件        629  2012-03-06 19:41  DataMiningClassify\.settings\org.eclipse.jdt.core.prefs

     文件        932  2012-03-26 00:41  DataMiningClassify\bin\com\pku\yangliu\ClassifierMain.class

     文件       8525  2012-03-26 00:09  DataMiningClassify\bin\com\pku\yangliu\ComputeWordsVector.class

     文件       4393  2012-03-26 00:08  DataMiningClassify\bin\com\pku\yangliu\CreateTrainAndTestSample.class

     文件       4429  2012-03-26 01:16  DataMiningClassify\bin\com\pku\yangliu\DataPreProcess.class

     文件       1442  2012-03-26 00:15  DataMiningClassify\bin\com\pku\yangliu\KNNClassifier$ByValueComparator.class

     文件      11114  2012-03-26 00:15  DataMiningClassify\bin\com\pku\yangliu\KNNClassifier.class

     文件      11271  2012-03-26 00:41  DataMiningClassify\bin\com\pku\yangliu\NaiveBayesianClassifier.class

     文件       7622  2012-03-23 00:50  DataMiningClassify\bin\com\pku\yangliu\Stemmer.class

     文件        600  2012-03-26 00:40  DataMiningClassify\src\com\pku\yangliu\ClassifierMain.java

     文件       7758  2012-03-26 00:09  DataMiningClassify\src\com\pku\yangliu\ComputeWordsVector.java

     文件       3616  2012-03-26 00:01  DataMiningClassify\src\com\pku\yangliu\CreateTrainAndTestSample.java

     文件       4397  2012-03-26 01:16  DataMiningClassify\src\com\pku\yangliu\DataPreProcess.java

     文件      11983  2012-03-26 00:15  DataMiningClassify\src\com\pku\yangliu\KNNClassifier.java

     文件      11489  2012-03-26 00:41  DataMiningClassify\src\com\pku\yangliu\NaiveBayesianClassifier.java

     文件      14649  2012-03-07 20:25  DataMiningClassify\src\com\pku\yangliu\PorterAlgorithm.java

     目录          0  2012-03-26 01:25  DataMiningClassify\bin\com\pku\yangliu

     目录          0  2012-03-26 01:25  DataMiningClassify\src\com\pku\yangliu

     目录          0  2012-03-26 01:25  DataMiningClassify\bin\com\pku

     目录          0  2012-03-26 01:25  DataMiningClassify\src\com\pku

     目录          0  2012-03-26 01:25  DataMiningClassify\bin\com

     目录          0  2012-03-26 01:25  DataMiningClassify\src\com

     目录          0  2012-03-26 01:25  DataMiningClassify\.settings

     目录          0  2012-03-26 01:25  DataMiningClassify\bin

     目录          0  2012-03-26 01:25  DataMiningClassify\src

............此处省略4个文件信息

评论

共有 条评论