源码之巅峰

维基百科中文语料已分词

收藏(0)

大小: 650B

文件类型: .zip

金币: 2

下载: 0 次

发布日期: 2024-01-28
语言: 其他
标签: 维基 中文语料 word2vec

高速下载

资源简介

自己用来训练word2vec的，已提取文本，做了分词处理，过滤了大部分的特殊字符。共包含3273626个段落的文本（一个段落包含了多个语句）。处理后的语料有1.1G，由于文件较大，提供百度网盘下载地址。

资源截图

小图大图

代码片段和文件信息

上一篇：中国移动笔试题库，很全很大哦，我已经笔试过了，绝对有用！
下一篇：最全中文情感和语义词库

评论

共有条评论

相关资源