源码之巅峰
全部资源
全部资源
C/C++
C#
PHP
Java
Python
VB
ASP
Html/CSS
Matlab
JavaScript
数据库
模板
其他
上传
VIP购买
登录
注册账号
C#
C/C++
PHP
Java
Python
VB
ASP
Html/CSS
Matlab
JavaScript
数据库
模板
AI
其他
当前位置:> TAG标签 >
中文语料
维基百科中文语料已分词
0
编程语言:
其他
大小:
金币:
上传人:32332
发布日期:2024-01-28
自己用来训练word2vec的,已提取文本,做了分词处理,过滤了大部分的特殊字符。共包含3273626个段落的文本(一个段落包含了多个语句)。处理后的语料有1.1G,由于文件较大,提供百度
中文情感分析语料整理
1
编程语言:
其他
大小:
金币:
上传人:haoyisheng
发布日期:2023-06-26
# 语料库说明------------------------------------------------------------------------## 词典1、HowNet 情感词典2、ntusd 情感词典3、情感分析停用词表4、结巴分词自定义词典5、常用语词典,包括流行新词,
中文自然语言处理中文分词训练语料
1
编程语言:
其他
大小:
金币:
上传人:shangyou88
发布日期:2022-09-23
本次提供的中文汉语语料syj_trainCorpus_utf8.txt全网免费,转载需要注明出处,语料是作者通过爬取的短文本和网络上的预料处理、合并生成的。整个语料大小264M,包含1116903条数据,数据用
中文命名实体识别语料大集合MSRA+人民
2
编程语言:
其他
大小:
金币:
上传人:chaoshanxx
发布日期:2021-04-07
整理了一下经典的中文命名实体识别语料。压缩包内含有:(1)微软亚研院MSRA:46365条语料(2)人民日报:23061条语料(3)Boson:2000条语料
4条
热门下载
中文命名实体识别语料大集合MSRA+人民
中文自然语言处理中文分词训练语料
中文情感分析语料整理
维基百科中文语料已分词