资源简介
本次提供的中文汉语语料syj_trainCorpus_utf8.txt全网免费,转载需要注明出处,语料是作者通过爬取的短文本和网络上的预料处理、合并生成的。整个语料大小264M,包含1116903条数据,数据用空格隔开,可以用来训练分词模型。
代码片段和文件信息
相关资源
- LCSTS高质量中文短文本摘要数据集
- 语料库.zip
- 情感词极值表,台湾大学NTUSD简体中文
- 台湾大学NTUSD简体中文情感词典+知网
- 人民日报2014语料库(全)
- 新闻分类语料
-
zhwiki-20200720-pages-articles4.xm
l-p265461 - 中文维基百科语料库百度网盘网址.
- 人民日报语料库中文分词语料库
- 人民日报语料库-非常好
- 哈工大深圳NLP考试参考
- 人民网,中新网新闻语料库,几百条
- 中文基础情感词典(NTUSD/HowNet/Tsingh
- 新闻语料库
- 中文维基百科语料库截止2019年2月20日
- 中文维基百科语料-可用于词向量训练
- 1998年1月-6月人民日报语料库
- PFR语料库-人民日报
- 自然语言处理、文本挖掘论文40篇 包
- people_daily_2014_corpus.zip
- 维基百科中文语料已分词
- 中英平行语料库约10M
- 中文垃圾短信数据集NLP
- 国际语料库与二语习得前沿演进的可
- ChineseGLUE_lcqmc.zip
- 搜狗中文文本分析语料库
- 中英双语机器学习训练用的语料库
- 北大人民日报语料库1998两份带词性标
- 人民日报语料1.rar
- 处理好的人民日报语料,可以直接用
评论
共有 条评论