中文文本分类语料由复旦大学李荣陆提供（附停用词.rar

大小: 86.75MB

文件类型: .rar

金币: 1

下载: 0 次

发布日期: 2023-07-19
语言: 其他
标签: 文本分类 语料 停用词

高速下载

资源简介

1、资源中有语料，本语料库由复旦大学李荣陆提供。test_corpus为测试语料，共9833篇文档；train_corpus为训练语料，共9804篇文档，两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源（复旦大学计算机信息与技术系国际数据库中心自然语言处理小组）。
2、资源中还附有一份停用词。

资源截图

小图大图

代码片段和文件信息

属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件  106752845  2019-11-29 20:44  语料（附停用词）\data.rar

     文件      21539  2019-11-29 16:02  语料（附停用词）\stopword.txt

     目录          0  2019-12-01 21:36  语料（附停用词）

----------- ---------  ---------- -----  ----

            106774384                    3

上一篇：产品设计与开发第五版美卡尔·T. 乌利齐
下一篇：Linux高级程序设计中文第三版.pdf

共有条评论

中文文本分类语料由复旦大学李荣陆提供（附停用词.rar

资源简介

资源截图

代码片段和文件信息

评论

相关资源