资源简介
该语料共包含中文和英文两种语言,主要是商品评论,评论篇幅都比较短,可以被应用于篇章级或者句子级的情感分析任务。数据集被分为训练数据、测试数据、带标签的测试数据三个文件,共有正向和负向两种极性。
情感分析资源大全:http://blog.csdn.net/qq280929090/article/details/70838025
代码片段和文件信息
#! /usr/bin/env python
#coding=utf-8
from __future__ import division
import copy
import sys
path=sys.argv[1]
reader=open(path‘rb‘)
lines_1=reader.read().split(‘\n‘)
lines=[]
for line in lines_1:
line_temp=copy.deepcopy(line)
if len(line_temp.strip())<>0:
lines.append(line)
reader.close()
output=open(r‘check.txt‘‘w‘)
right=True
if len(lines)<>2500:
print ‘row count error.‘
right=False
for iline in enumerate(lines):
str_list=line.split()
if len(str_list)<>4:
print ‘column count error at row %d‘ %i
exit()
right=False
try:
id=int(str_list[1])
except:
print ‘2nd column at row %d must be interger‘ %i
right=False
try:
sample_id=int(str_list[2])
if(sample_id>=2500 or sample_id <0):
print ‘id number error at row %d‘ %i
right=False
except:
print ‘3rd column at row %d must be interger‘ %i
right=False
if str_list[3]<>‘negative‘ and str_list[3]<>‘positive‘:
print ‘4th column at row %d must be positive or negative‘ %i
right=False
if right:
print ‘check passed...‘
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-01-21 16:09 NLPCC2014评估任务2_基于深度学习的情感分类\
目录 0 2018-01-21 16:06 NLPCC2014评估任务2_基于深度学习的情感分类\test\
文件 776 2014-05-23 10:54 NLPCC2014评估任务2_基于深度学习的情感分类\test\README.txt
文件 1274 2014-05-23 10:51 NLPCC2014评估任务2_基于深度学习的情感分类\test\check_format.py
目录 0 2018-01-21 16:06 NLPCC2014评估任务2_基于深度学习的情感分类\test\submission_sample\
目录 0 2018-01-21 16:06 NLPCC2014评估任务2_基于深度学习的情感分类\test\submission_sample\TeamN_Submission\
文件 58 2014-05-21 10:48 NLPCC2014评估任务2_基于深度学习的情感分类\test\submission_sample\TeamN_Submission\TeamN_1_CN.txt
文件 58 2014-05-21 10:48 NLPCC2014评估任务2_基于深度学习的情感分类\test\submission_sample\TeamN_Submission\TeamN_1_EN.txt
文件 532235 2014-05-21 10:38 NLPCC2014评估任务2_基于深度学习的情感分类\test\test.cn.txt
文件 1893201 2014-05-21 10:37 NLPCC2014评估任务2_基于深度学习的情感分类\test\test.en.txt
目录 0 2018-01-21 16:05 NLPCC2014评估任务2_基于深度学习的情感分类\test_with_label\
文件 559732 2014-06-24 10:26 NLPCC2014评估任务2_基于深度学习的情感分类\test_with_label\test.label.cn.txt
文件 1938680 2014-06-24 10:26 NLPCC2014评估任务2_基于深度学习的情感分类\test_with_label\test.label.en.txt
目录 0 2014-05-06 10:29 NLPCC2014评估任务2_基于深度学习的情感分类\trian\
目录 0 2018-01-21 16:03 NLPCC2014评估任务2_基于深度学习的情感分类\trian\cn_sample_data\
文件 1078082 2014-05-06 10:29 NLPCC2014评估任务2_基于深度学习的情感分类\trian\cn_sample_data\sample.negative.txt
文件 1067415 2014-05-06 10:29 NLPCC2014评估任务2_基于深度学习的情感分类\trian\cn_sample_data\sample.positive.txt
目录 0 2018-01-21 16:03 NLPCC2014评估任务2_基于深度学习的情感分类\trian\en_sample_data\
文件 4135659 2014-05-13 13:26 NLPCC2014评估任务2_基于深度学习的情感分类\trian\en_sample_data\sample.negative.txt
文件 3451626 2014-05-13 13:26 NLPCC2014评估任务2_基于深度学习的情感分类\trian\en_sample_data\sample.positive.txt
相关资源
- NLPCC2013评估任务_中文微博观点要素抽
- 微博情感分析,文本分类,毕业设计
- 中文酒店情感分析语料,标注了打分
- 基于SVM中文情感分析
- Go-一个golang的编写的情感分析小程序
- 中文情感分析 酒店评论预料
- 评论情感分析数据集
- 微博语料情感分析代码
- 中文评论情感分析数据集
- ChnSentiCorp_htl_ba_4K.zip
- 中文情感分析 语料数据 酒店评论
- 大连理工大学情感词汇本体库无辅助
- 微博评论情感数据集(清洗之后的,
- 中文文本情感分析超级字典包.zip
- 读书笔记之10情感分析论文阅读
- 6w条豆瓣电影短评
- Al_challenger细粒度情感分析数据集
- 基于开源情感倾向分类数据集ChnSent
- AI Challenger 2018 细粒度用户评论情感分
- 斯坦福大学收集的评论情感分析数据
- 美团细粒度用户评论情感分析数据集
- coae2014评测数据和NLPCC2014评测数据汇总
- 微博情感分析数据集
- 谭松波老师8++酒店评论++语料-1w条
- NLPCC2013评估任务_跨领域情感分类
- 图像情感分析数据集
- nlpcc2013微博情绪分析任务测试集及答
- 中文情感酒店评论语料
- DataFountain 互联网新闻情感分析数据集
- NLPCC2014任务1和任务2微博情感分析语料
评论
共有 条评论