资源简介
该数据集是用于命名实体识别训练模型的数据集,该数据集中包含6中标签,分别是人名、地名、时间、组织机构名、公司名、产品名。遵循BIO编码。里面有三个文件,分别是训练集,测试集,验证集。样例如下:
以 O
及 O
以 O
康 B-COMPANY_NAME
宽 I-COMPANY_NAME
为 O
代 O
表 O
的 O
国 O
外 O
专 O
利 O
产 O
品 O
低 O
毒 O
杀 O
虫 O
剂 O
吡 B-PRODUCT_NAME
虫 I-PRODUCT_NAME
啉 I-PRODUCT_NAME
和 O
生 O
物 O
农 O
药 O
阿 B-PRODUCT_NAME
维 I-PRODU
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 463204 2020-10-26 15:03 命名实体识别数据集\dev.txt
文件 465339 2020-10-26 15:03 命名实体识别数据集\test.txt
文件 3533573 2020-10-26 14:14 命名实体识别数据集\train.txt
目录 0 2020-11-03 11:01 命名实体识别数据集
----------- --------- ---------- ----- ----
4462116 4
----------- --------- ---------- ----- ----
文件 463204 2020-10-26 15:03 命名实体识别数据集\dev.txt
文件 465339 2020-10-26 15:03 命名实体识别数据集\test.txt
文件 3533573 2020-10-26 14:14 命名实体识别数据集\train.txt
目录 0 2020-11-03 11:01 命名实体识别数据集
----------- --------- ---------- ----- ----
4462116 4
评论
共有 条评论