资源简介
NLP中常用的PTB语料库,全名Penn Treebank。
Penn Treebank是一个项目的名称,项目目的是对语料进行标注,标注内容包括词性标注以及句法分析。
语料来源为:1989年华尔街日报
语料规模:1M words,2499篇文章
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 884846 2011-02-23 22:08 data\ptb.char.test.txt
文件 10034964 2011-02-23 22:08 data\ptb.char.train.txt
文件 786084 2011-02-23 22:08 data\ptb.char.valid.txt
文件 449945 2010-08-07 07:32 data\ptb.test.txt
文件 5101618 2010-08-07 07:32 data\ptb.train.txt
文件 399782 2010-08-07 07:31 data\ptb.valid.txt
文件 609 2011-09-13 11:04 data\README
目录 0 2019-04-07 14:57 data
----------- --------- ---------- ----- ----
17657848 8
----------- --------- ---------- ----- ----
文件 884846 2011-02-23 22:08 data\ptb.char.test.txt
文件 10034964 2011-02-23 22:08 data\ptb.char.train.txt
文件 786084 2011-02-23 22:08 data\ptb.char.valid.txt
文件 449945 2010-08-07 07:32 data\ptb.test.txt
文件 5101618 2010-08-07 07:32 data\ptb.train.txt
文件 399782 2010-08-07 07:31 data\ptb.valid.txt
文件 609 2011-09-13 11:04 data\README
目录 0 2019-04-07 14:57 data
----------- --------- ---------- ----- ----
17657848 8
- 上一篇:东软医保监控数据库表结构
- 下一篇:图形交互系统设计
相关资源
- Neural Networks and Deep Learning神经网络与
- 神经网络与深度学习2018年4月4日0.5版
- 基于BP神经网络的时间序列预测
- 模糊控制 PPT非常详细
- 基于卷积神经网络深度学习的物品分
- 基于FPGA的卷积神经网络加速器
- 基于神经网络的表面肌电信号分类方
- opencv 神经网络分类
- 人工神经网络理论、设计及应用
- 人工智能--循环神经网络
- 基于神经网络的问答系统
- 吴恩达LogisticRegression识别猫数据集
- 吴恩达神经网络和深度学习,第一课
- 深度神经网络的工具类和数据集dnn_
- 深度学习:CNN卷积神经网络讲解pdf
- 粒子群优化BP神经网络的权值和阈值
- PCNN+形态学降噪
- 血管图像分割
- lstm长短时记忆神经网络PPT
- 基于改进的广义回归神经网络的态势
- 5篇关于bp神经网络与pid的学术论文
- 基于概率神经网络的模式识别.pdf
- BP神经网络实现手写体数字识别
- SOM神经网络.zip
- 《RapidMiner数据分析与挖掘实战》第
- 基于卷积神经网络的车牌字符识别_董
- 神经网络算法在自适应卡尔曼滤波器
- 基于BP神经网络的高斯模糊图像复原方
- 并行化实现基于BP神经网络的手写体数
- Neural_Networks_for_Applied_Sciences_and_Engin
评论
共有 条评论