资源简介
编码格式为GBK。
是网上流传的测试集和训练集的合并版。
用户获取后要自行清洗语料。
代码片段和文件信息
相关资源
- 搜狐2012新闻语料已分类,utf8格式
- 新闻类中文文本分类数据集
- 中文文本分类语料复旦训练集+测试集
- 面向大数据的高效能垃圾文本分类
- 数学分析复旦大学数学系编的答案
- 复旦大学_软件安全_SEED labs_1-Buffer O
- 基于LDA主题模型的短文本分类方法_张
- 基于LDA高频词扩展的中文短文本分类
- 基于LDA 主题模型的短文本分类方法
- 完整用CNN(Tensorflow)完成文本分类的
- 复旦大学计算机考研复试历年上机题
- 文本分类时所用的中英文停用词表
- 北邮计算机研一《数据挖掘》文本分
- sogou中文语料库
- 论文研究-基于不同文本表示协同训练
- SVM和lda结合的文本分类
- 基于n-gram的文本分类
- 知乎文本分类竞赛 数据集1/2
- svm和lstm用于文本分类
- TextCNN在文本分类的应用.pptx
- 2019复旦大学961真题题回忆版.docx
- 文本分类中文语料库
- text-cnn源代码
- 基于贝叶斯及KNN算法的newsgroup文本分
- 通过Mahout构建贝叶斯文本分类器案例
- 17 机器学习案例——基于朴素贝叶斯
- 搜狗1.4G 新闻集
- 文本分类之词频统计分词、词干提取
- 中文文本分类停用词表
- 中文京东商品评论数据集
评论
共有 条评论