资源简介
LCQMC数据集
输入是两个句子,输出是 0 或 1。其中 0 代表语义不相似,1 代表语义相似。
数据量:训练集 (238,766),验证集 (8,802),测试集 (12,500)
例子:
1. 聊天室都有哪些好的 [分隔符] 聊天室哪个好 [分隔符] 1
2. 飞行员没钱买房怎么办?[分隔符] 父母没钱买房子 [分隔符] 0
输入是两个句子,输出是 0 或 1。其中 0 代表语义不相似,1 代表语义相似。
数据量:训练集 (238,766),验证集 (8,802),测试集 (12,500)
例子:
1. 聊天室都有哪些好的 [分隔符] 聊天室哪个好 [分隔符] 1
2. 飞行员没钱买房怎么办?[分隔符] 父母没钱买房子 [分隔符] 0
代码片段和文件信息
相关资源
- NLPCC2014 微博情感分析样例数据
- 2016年国科大NLP自然语言处理期末考试
- 来自于NLPCC2013,解析成txt文件 不均衡
- Deep Learning for NLP and Speech Recognition.p
- 基于深度学习的自然语言处理 英文版
- 中文文本情感分类已标注
- 用RNN与LSTM网络原理进行唐诗生成.ta
- Chinese NER data MSRA 中文命名实体识别语
- Bert-Chinese-Text-Classification-Pytorch-maste
- THE INNER WORKINGS OF WORD2VEC
- wikiqa 数据集
- 蚂蚁金服文本匹配竞赛训练数据
- Reinforcement Learning in Natural Language Pro
- 自然语言处理技术
- 哈工大 同义词词林
- NLPCC2014情感分类语料集+已经标注好
- 已预处理 NLP 英文语料库 新闻组 20
- 中文NLP命名实体识别序列标注工具Y
- Natural Language Processing with PyTorch - 201
- tf-idf算法.zip
- BosonNLP数据的情感词典
- 中文实体词典(NLP必备)
- NLPCC2013评估任务_中文微博观点要素抽
- NLPCC2014评估任务2_基于深度学习的情感
- webrtc中NLP处理
- Neural Network Methods in Natural Language Pro
- 豆瓣5万条影评数据集
- NLPIR分词、去停用词
- zw_NlPIR.zip
- hanlp-1.7.2-release.zip
评论
共有 条评论