• 大小: 3.26MB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2023-09-13
  • 语言: 其他
  • 标签: PTB  

资源简介

NLP中常用的PTB语料库,全名Penn Treebank。 Penn Treebank是一个项目的名称,项目目的是对语料进行标注,标注内容包括词性标注以及句法分析。 语料来源为:1989年华尔街日报 语料规模:1M words,2499篇文章

资源截图

代码片段和文件信息

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件     884846  2011-02-23 22:08  data\ptb.char.test.txt

     文件   10034964  2011-02-23 22:08  data\ptb.char.train.txt

     文件     786084  2011-02-23 22:08  data\ptb.char.valid.txt

     文件     449945  2010-08-07 07:32  data\ptb.test.txt

     文件    5101618  2010-08-07 07:32  data\ptb.train.txt

     文件     399782  2010-08-07 07:31  data\ptb.valid.txt

     文件        609  2011-09-13 11:04  data\README

     目录          0  2019-04-07 14:57  data

----------- ---------  ---------- -----  ----

             17657848                    8


评论

共有 条评论