资源简介
自己用来训练word2vec的,已提取文本,做了分词处理,过滤了大部分的特殊字符。
共包含3273626个段落的文本(一个段落包含了多个语句)。
处理后的语料有1.1G,由于文件较大,提供百度网盘下载地址。
代码片段和文件信息
相关资源
- .net开源的维基百科系统
- 唐宇迪word2vec的系列代码自然语言处理
- word2vec 源码和pdf
- THE INNER WORKINGS OF WORD2VEC
- aiml中文语料
- 搜狗中文语料库
- 爬虫+分词+Word2vec向量化的实现.zip
- 图像降维基本理论
- 深度学习word2vec学习笔记.docx
- word2vec中的数学原理详解_peghoty
- HDWiki-v5.1GBK-20181112.zip
- word2vec_中的数学原理详解
- 深度学习中word2vector测试语料text8
- 中文维基glove词向量已训练-part2
- 深度学习word2vector测试语料text8
- 中文维基语料Word2Vec训练模型
- 中文维基glove词向量已训练-part1
- word2vec_中的数学原理详解.pdf164150
- 中文情感分析语料整理
- dataSet_word2vec训练词向量
- Google word2vec算法 数学原理
- word2vec Pytorch实现文本数据
- word2vec词向量训练及中文文本相似度计
- Word2vec谷歌词向量
- 基于LSTM长短期记忆的影评情感分析
- 复旦大学中文文本分类数据集-训练
- 搜狐新闻中文语料已分类整理
- 论文研究-基于word2vec扩展情感词典和
- 通过wiki生成word2vec模型的
- google word2vec开源项目
评论
共有 条评论