资源简介
Words-240测试集包含240对中文词汇和人工对这些词对之间的语义相关度的评测值(和英文的WordSimilarity-353测试集类似),此测试集可以用于测试或者训练中文语义相关度算法。我们以组为单位安排人员进行测试,共分为12组,每组包含20对词。每一组词汇都有20人分别对其相关性进行量化评测,
共有240余人参与了测试。词汇之间相关性的度量值介于0到10之间(0表示这两个词之间毫不相关,10表示这两个词是同义词),我
们将这20个人对某词对的评测结果的平均值作为最终结果。每个人的评价结果请参见“测试集统计结果.xls”。如果您有什么问题或者评论,请您发邮件和我们联系,邮件地址是:
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 4961 2011-07-22 17:18 words-240发布\Words-240.txt
文件 102400 2011-07-22 16:15 words-240发布\测试集统计结果.xls
文件 3329 2011-07-22 17:19 words-240发布\说明Instruction.txt
目录 0 2011-07-22 17:18 words-240发布
----------- --------- ---------- ----- ----
110690 4
----------- --------- ---------- ----- ----
文件 4961 2011-07-22 17:18 words-240发布\Words-240.txt
文件 102400 2011-07-22 16:15 words-240发布\测试集统计结果.xls
文件 3329 2011-07-22 17:19 words-240发布\说明Instruction.txt
目录 0 2011-07-22 17:18 words-240发布
----------- --------- ---------- ----- ----
110690 4
- 上一篇:用CSocket类实现的聊天室程序
- 下一篇:两款黑苹果电池驱动kext
评论
共有 条评论