资源简介
该资源主要参考我的博客:word2vec词向量训练及中文文本相似度计算
http://blog.csdn.net/eastmount/article/details/50637476
其中包括C语言的Word2vec源代码(从官网下载),自定义爬取的三大百科(百度百科、互动百科、维基百科)中文语料,涉及到国家、景区、动物和人物。
同时包括60M的腾讯新闻语料,是一个txt,每行相当于一个新闻。
国家包括了Python的Jieba分词代码,详见博客。
免费资源希望对你有所帮助~
代码片段和文件信息
相关资源
- 精通VC++指纹模式识别系统算法(源码
- C++学生成绩管理系统( 毕业设计)
- C语言c++游戏源代码大全
- 主站104规约源码
- c++P2P视频技术源码(VC++)
- 大漠插件的模仿插件天使插件源码
- c++ 源码通过dll启动应用程序exe
- c++stl标准库源码
- 即时通讯开发源码终极版C#.NETC++都有
- 《测试驱动的嵌入式C语言开发》源码
- 树莓派智能小车开发C语言源码
- 植物大战僵尸外挂源码
- vc 视频会议系统v2.8 源码
- 标准C++STL源码剖析(侯捷著)(非扫
- celrityC/C++源码查看工具
- (部分源码)百分百仿360安全卫士界
- puma560的运动学正解和逆解的C++源码
- sm2算法源码实现
- 剑灵辅助源码
- c语言标准库源码大全
- QT5.9_c++开发指南——随书[源码]
- 网络调试助手C++源码(VS 2008开发)
- 基于c++的科大讯飞源码
- AES GCM算法源码
- 基于包过滤技术防火墙设计源码+论文
- C++商品管理系统50页报告+源码。代码
- 超声波测距及蓝牙模块源码程序c语言
- 基于socket文件传输的实现源码[C++]
- VC++ MFC 串口通信20个经典源码合集
- 俄罗斯方块源码用VC开发
评论
共有 条评论