• 大小: 50.38MB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2022-12-01
  • 语言: 其他
  • 标签:

资源简介

这个链接是训练集,测试集请见我的资源 本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料基本按照1:1的比例来划分。使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试各50多兆),下载时请耐心等待。

资源截图

代码片段和文件信息

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件   52827271  2013-05-15 21:07  617249.rar

     文件        531  2011-09-01 09:08  README-datatang.txt

     文件        132  2013-05-23 17:27  url.txt

----------- ---------  ---------- -----  ----

             52827934                    3


评论

共有 条评论