资源简介
本报告包括详尽完整的文本分类处理过程,包括语料库的处理、jieba分词、停用词无关词处理、词袋模型的构建(CHI值检验用于特征筛选、tfidf作为特征向量值)。并用自编朴素贝叶斯以及sklearn包中的SVM进行了文本效果的检测,通过混淆矩阵和roc曲线展现了实现效果。实验报告写的很详细,不懂的地方可以看报告以及看博客中的部分细节讲解。
代码片段和文件信息
- 上一篇:S-57电子海图文件
- 下一篇:电机统一理论英 阿德金斯PDF
相关资源
- 数据挖掘概念与技术答案汇总
- IBM SPSS Modeler 18.0 中文用户指南.pdf
- IBM SPSS Modeler 18.0 程序应用指南中文
- 《标签:标记系统设计实践》迷你书
- 数据挖掘:实用案例分析02
- 数据挖掘 概念与技术 中文第三版 高
- 文本分类所需停用词表
- 基于svm的中文文本分类系统
- 最新数据挖掘真题-刘莹
- 数据挖掘导论完整版
- 哈工大数据挖掘理论与算法 作业2
- 数据挖掘导论高清完整版
- CLEMENTINE数据挖掘方法及应用 薛薇
- 数据挖掘算法原理与实现第2版.王振武
- 传感器数据集大数据分析温度、湿度
- 关于数据挖掘方向的优秀硕士论文
- 数据挖掘设计.zip
- weka软件最全数据集
- 数据挖掘 你必须知识的32个经典案例
- 鸢尾花数据相关绘图天津理工大学研
- 数据挖掘:概念与技术 第3版(带书签
- 数据挖掘案例分析
- 网易文本分类数据 - 好东西
- 大数据 互联网大规模数据挖掘与分布
- 数据挖掘---决策树
- 数据挖掘工具 Weka3.7
- 时间序列数据挖掘中的特征表示与相
- 社交网络 SNS 技术基础与开发案例_P
- 银行业数据挖掘案例.
- 卡方特征词选择法选取1000个特征词
评论
共有 条评论