资源简介
本报告包括详尽完整的文本分类处理过程,包括语料库的处理、jieba分词、停用词无关词处理、词袋模型的构建(CHI值检验用于特征筛选、tfidf作为特征向量值)。并用自编朴素贝叶斯以及sklearn包中的SVM进行了文本效果的检测,通过混淆矩阵和roc曲线展现了实现效果。实验报告写的很详细,不懂的地方可以看报告以及看博客中的部分细节讲解。
代码片段和文件信息
- 上一篇:S-57电子海图文件
- 下一篇:电机统一理论英 阿德金斯PDF
相关资源
- 数据挖掘(重心法迭代.xlsx)
- eServer z 系列服务器数据挖掘解决方案
- 基于粗糙集神经网络的数据挖掘在门
- 常用数据挖掘数据集
- 93年-2006年全国各地级市、县的GDP
- 粗糙集算法论文
- 国科大数据挖掘大作业2018交通拥堵预
- WEKA arff 实验数据集---数据挖掘用
- 数据挖掘18大算法实现以及其他相关经
- 哈尔滨工业大学深圳 数据挖掘 2017 考
- 机器学习方法R实现-用决策树、神经网
- 七月学习--数据挖掘基础
- 轨迹数据挖掘各种行为
- 1998年1月-6月人民日报语料库
- 数据挖掘导论完整版PPT及课后习题答
- 数据挖掘在各行业的应用论文
- decisiontree决策树在adult数据集上的实现
- KNIME教程加demo
- 基于数据挖掘技术的液压泵的故障诊
- 基于数据挖掘技术的掘进机工况监测
- 国科大数据挖掘期末考试试题
- 基于DBAN的监控视频数据挖掘
- 南理工数据挖掘大作业网站评级Sysk
- NLPCC2014 微博情感分析样例数据
- 数据挖掘、机器学习在客户细分中应
- 用R语言进行电影评论挖掘
- 自然语言处理之文本主题判别
- 基于LDA特征扩展的短文本分类_吕超镇
- Pajek 安装程序
- 数据挖掘技术:市场营销、销售与客户
评论
共有 条评论