• 大小: 3.81MB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2023-11-13
  • 语言: 其他
  • 标签:

资源简介

为了弥补国内在中文情感挖掘方面的语料的匮乏,谭松波收集整理了一个较大规模的酒店评论语料。语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4个子集: 1.ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000篇。 2.ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇。 3.ChnSentiCorp-Htl-ba-6000: 平衡语料,正负类各3000篇。 4.ChnSentiCorp-Htl-unba-10000: 非平衡语料,正类为7000篇。

资源截图

代码片段和文件信息

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件     636062  2011-10-28 09:14  中文情感挖掘酒店评论语料\ChnSentiCorp_htl_ba_2000.rar

     文件    1264778  2011-10-28 09:14  中文情感挖掘酒店评论语料\ChnSentiCorp_htl_ba_4000.rar

     文件    1902409  2011-10-28 09:14  中文情感挖掘酒店评论语料\ChnSentiCorp_htl_ba_6000.rar

     文件    3103585  2011-10-28 09:15  中文情感挖掘酒店评论语料\ChnSentiCorp_htl_unba_10000.rar

     目录          0  2011-10-28 09:16  中文情感挖掘酒店评论语料

----------- ---------  ---------- -----  ----

              6906834                    5


评论

共有 条评论

相关资源