资源简介
NLP中常用的PTB语料库,全名Penn Treebank。
Penn Treebank是一个项目的名称,项目目的是对语料进行标注,标注内容包括词性标注以及句法分析。
语料来源为:1989年华尔街日报
语料规模:1M words,2499篇文章

代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 884846 2011-02-23 22:08 data\ptb.char.test.txt
文件 10034964 2011-02-23 22:08 data\ptb.char.train.txt
文件 786084 2011-02-23 22:08 data\ptb.char.valid.txt
文件 449945 2010-08-07 07:32 data\ptb.test.txt
文件 5101618 2010-08-07 07:32 data\ptb.train.txt
文件 399782 2010-08-07 07:31 data\ptb.valid.txt
文件 609 2011-09-13 11:04 data\README
目录 0 2019-04-07 14:57 data
----------- --------- ---------- ----- ----
17657848 8
----------- --------- ---------- ----- ----
文件 884846 2011-02-23 22:08 data\ptb.char.test.txt
文件 10034964 2011-02-23 22:08 data\ptb.char.train.txt
文件 786084 2011-02-23 22:08 data\ptb.char.valid.txt
文件 449945 2010-08-07 07:32 data\ptb.test.txt
文件 5101618 2010-08-07 07:32 data\ptb.train.txt
文件 399782 2010-08-07 07:31 data\ptb.valid.txt
文件 609 2011-09-13 11:04 data\README
目录 0 2019-04-07 14:57 data
----------- --------- ---------- ----- ----
17657848 8
- 上一篇:东软医保监控数据库表结构
- 下一篇:图形交互系统设计
相关资源
- bp神经网络源代码,可直接运行
- 连续hopfield神经网络解决TSP问题
- 改进的BP神经网络算法
- 基于bp神经网络的表情识别
- 神经网络仿真工具源代码
- 使用卷积神经网络在e + e-对撞机上改
- 用labview编写的一个神经网络Vi图
- 基于改进的SOM神经网络在产品配置中
- 深度学习卷积神经网络可检测和分类
- 标量场理论的回归和生成神经网络
- 基于ARIMA、BP神经网络与GM的组合模型
- 车辆自适应神经网络编队控制
- 基于RBF神经网络在线辨识的永磁同步
- 基于BP人工神经网络的SmFeN永磁材料工
- 融合粗糙集和人工神经网络的产品敏
- 基于粗糙集神经网络的数据挖掘在门
- Google OCR API源代码和神经网络识别OC
- 信息融合、神经网络-模糊推理理论及
- 基于双隐含层BP神经网络的预测
- SOM神经网络 PPT
- 小波神经网络预测模型代码
- 基于PSO优化BP神经网络的水质预测研究
- 基于神经网络的时间序列预测方法
- BP神经网络算法逼近一个正弦函数
- Hopfield神经网络解决 TSP问题
- 基于神经网络的数字水印
- 基于概率神经网络的图匹配算法研究
- 基于神经网络的身份证号码识别算法
- 机器学习方法R实现-用决策树、神经网
- 基于神经网络及Logistic回归的混合信用
评论
共有 条评论