资源简介
中文文本分类语料(复旦)-训练集和测试集
这个链接是训练集,本语料库由复旦大学李荣陆提供。test_corpus为测试语料,共9833篇文档;train_corpus为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大,下载时请耐心等待。
代码片段和文件信息
相关资源
- 基于pytorch的UNet_demo实现及训练自己的
- 多目标跟踪MOT16_Benchmark数据集链接
- LCSTS高质量中文短文本摘要数据集
- 数学分析教材,复旦,陈传璋、金福
- 复旦dc综合工具教程
- EMC中国人寿再保险公司数据集中存储
- 银行搜索数据集(bankresearch dataset)
- 常用数据挖掘数据集
- Google论文\“Wide & Deep Learning for Recom
- 深度学习数据集标注
- WEKA arff 实验数据集---数据挖掘用
- 基于决策树和朴素贝叶斯算法对Adul
- kinetics600.tar.gz
- 系统中ETL和数据集市的架构设计和实
- titanic_dataset.csv泰坦尼克数据集
- 北大中文《人民日报》199801-199806数据
- 贝叶斯应用案例测试集及源码
- 消费金融场景下的用户购买预测_数据
- 深度学习: MNIST的数据集
- 1998年1月-6月人民日报语料库
- kaggle信用卡欺诈数据
- 中国地面气候资料日值数据集201801-
- WS 445-2014电子病历基本数据集1-17全集
- 今日头条38万条新闻数据标题
- Oxford花卉数据加文本描述数据集
- zhwiki-20200720-pages-articles-multistream5.xm
- 卫生部WS 445-2014电子病历基本数据集
- PHM2008 挑战赛数据集
- 中国地面气候资料日值数据集(V3.0)
- 案例实战信用卡欺诈检测数据集
评论
共有 条评论