资源简介
该语料共包含中文和英文两种语言,主要是商品评论,评论篇幅都比较短,可以被应用于篇章级或者句子级的情感分析任务。数据集被分为训练数据、测试数据、带标签的测试数据三个文件,共有正向和负向两种极性。
情感分析资源大全:http://blog.csdn.net/qq280929090/article/details/70838025

代码片段和文件信息
#! /usr/bin/env python
#coding=utf-8
from __future__ import division
import copy
import sys
path=sys.argv[1]
reader=open(path‘rb‘)
lines_1=reader.read().split(‘\n‘)
lines=[]
for line in lines_1:
line_temp=copy.deepcopy(line)
if len(line_temp.strip())<>0:
lines.append(line)
reader.close()
output=open(r‘check.txt‘‘w‘)
right=True
if len(lines)<>2500:
print ‘row count error.‘
right=False
for iline in enumerate(lines):
str_list=line.split()
if len(str_list)<>4:
print ‘column count error at row %d‘ %i
exit()
right=False
try:
id=int(str_list[1])
except:
print ‘2nd column at row %d must be interger‘ %i
right=False
try:
sample_id=int(str_list[2])
if(sample_id>=2500 or sample_id <0):
print ‘id number error at row %d‘ %i
right=False
except:
print ‘3rd column at row %d must be interger‘ %i
right=False
if str_list[3]<>‘negative‘ and str_list[3]<>‘positive‘:
print ‘4th column at row %d must be positive or negative‘ %i
right=False
if right:
print ‘check passed...‘
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2018-01-21 16:09 NLPCC2014评估任务2_基于深度学习的情感分类\
目录 0 2018-01-21 16:06 NLPCC2014评估任务2_基于深度学习的情感分类\test\
文件 776 2014-05-23 10:54 NLPCC2014评估任务2_基于深度学习的情感分类\test\README.txt
文件 1274 2014-05-23 10:51 NLPCC2014评估任务2_基于深度学习的情感分类\test\check_format.py
目录 0 2018-01-21 16:06 NLPCC2014评估任务2_基于深度学习的情感分类\test\submission_sample\
目录 0 2018-01-21 16:06 NLPCC2014评估任务2_基于深度学习的情感分类\test\submission_sample\TeamN_Submission\
文件 58 2014-05-21 10:48 NLPCC2014评估任务2_基于深度学习的情感分类\test\submission_sample\TeamN_Submission\TeamN_1_CN.txt
文件 58 2014-05-21 10:48 NLPCC2014评估任务2_基于深度学习的情感分类\test\submission_sample\TeamN_Submission\TeamN_1_EN.txt
文件 532235 2014-05-21 10:38 NLPCC2014评估任务2_基于深度学习的情感分类\test\test.cn.txt
文件 1893201 2014-05-21 10:37 NLPCC2014评估任务2_基于深度学习的情感分类\test\test.en.txt
目录 0 2018-01-21 16:05 NLPCC2014评估任务2_基于深度学习的情感分类\test_with_label\
文件 559732 2014-06-24 10:26 NLPCC2014评估任务2_基于深度学习的情感分类\test_with_label\test.label.cn.txt
文件 1938680 2014-06-24 10:26 NLPCC2014评估任务2_基于深度学习的情感分类\test_with_label\test.label.en.txt
目录 0 2014-05-06 10:29 NLPCC2014评估任务2_基于深度学习的情感分类\trian\
目录 0 2018-01-21 16:03 NLPCC2014评估任务2_基于深度学习的情感分类\trian\cn_sample_data\
文件 1078082 2014-05-06 10:29 NLPCC2014评估任务2_基于深度学习的情感分类\trian\cn_sample_data\sample.negative.txt
文件 1067415 2014-05-06 10:29 NLPCC2014评估任务2_基于深度学习的情感分类\trian\cn_sample_data\sample.positive.txt
目录 0 2018-01-21 16:03 NLPCC2014评估任务2_基于深度学习的情感分类\trian\en_sample_data\
文件 4135659 2014-05-13 13:26 NLPCC2014评估任务2_基于深度学习的情感分类\trian\en_sample_data\sample.negative.txt
文件 3451626 2014-05-13 13:26 NLPCC2014评估任务2_基于深度学习的情感分类\trian\en_sample_data\sample.positive.txt
相关资源
- 最新《知网》情感分析用词语集
- 朴素贝叶斯分类模型完整代码
- 台湾大学NTUSD,知网情感分析用词语集
- 最全的情感分析词库
- 情感分析-情感词典
- AI Challenger用户评论情感分析
- 微博情感分析论文7篇
- AI Challenger 细粒度用户评论情感分析
- 四个情感词典汇总.zip
- 台湾大学中文情感极性词典
- NLPCC2014 微博情感分析样例数据
- 来自于NLPCC2013,解析成txt文件 不均衡
- 新浪微博,情感分析标记语料共12万条
- 情感分析数据集
- 情感分析评论训练数据
- 中文情感分析 语料数据 酒店评论
- 谭松波-酒店评论语料-utf8gb 两种格式
- Sentiment Analysis and Opinion Mining_BingLiu
- 基于 SVM 的中文微博情感分析的研究
- 中文情感分析语料库
- 情感分析数据集正面10000条,负面50
- NLPCC2014情感分类语料集+已经标注好
- 贝叶斯模型LDA贝叶斯算法实现的电商
- 基于社交网络的情绪化分析
- 情感分析语料-谭松波酒店评论语料
- BosonNLP数据的情感词典
- NLPCC2013评估任务_中文微博观点要素抽
- 微博情感分析,文本分类,毕业设计
- 中文酒店情感分析语料,标注了打分
- 基于SVM中文情感分析
评论
共有 条评论