资源简介
吸收了 谭松波 非平衡酒店评论语料库(7000条正面,3000条负面,有部分重复数据),加上我从携程上抓取的数据,经过繁简转换、去重、去掉4字以下过短评论,形成最终的评论数据集(10000条正面,5000条负面,文本中每行为一个评论),欢迎下载使用!ps.数据正负面归类是按照携程上“值得推介”和“有待改善”栏目做初步区分,然后再经过人工筛选剔除归类错误的数据形成,因此难免会有错误,欢迎修正!358473546@qq.com
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 1032442 2017-07-17 20:06 neg.txt
文件 1470393 2017-07-16 22:31 pos.txt
----------- --------- ---------- ----- ----
2502835 2
----------- --------- ---------- ----- ----
文件 1032442 2017-07-17 20:06 neg.txt
文件 1470393 2017-07-16 22:31 pos.txt
----------- --------- ---------- ----- ----
2502835 2
- 上一篇:60GHz+RoF传输系统室内毫米波空间传输信道的研究
- 下一篇:中文情感分析语料库
相关资源
- 基于pytorch的UNet_demo实现及训练自己的
- 多目标跟踪MOT16_Benchmark数据集链接
- LCSTS高质量中文短文本摘要数据集
- EMC中国人寿再保险公司数据集中存储
- 银行搜索数据集(bankresearch dataset)
- 常用数据挖掘数据集
- Google论文\“Wide & Deep Learning for Recom
- 深度学习数据集标注
- WEKA arff 实验数据集---数据挖掘用
- 基于决策树和朴素贝叶斯算法对Adul
- kinetics600.tar.gz
- 系统中ETL和数据集市的架构设计和实
- titanic_dataset.csv泰坦尼克数据集
- 北大中文《人民日报》199801-199806数据
- 贝叶斯应用案例测试集及源码
- 消费金融场景下的用户购买预测_数据
- 深度学习: MNIST的数据集
- kaggle信用卡欺诈数据
- 中国地面气候资料日值数据集201801-
- WS 445-2014电子病历基本数据集1-17全集
- 今日头条38万条新闻数据标题
- Oxford花卉数据加文本描述数据集
- zhwiki-20200720-pages-articles-multistream5.xm
- 卫生部WS 445-2014电子病历基本数据集
- PHM2008 挑战赛数据集
- 中国地面气候资料日值数据集(V3.0)
- 案例实战信用卡欺诈检测数据集
- decisiontree决策树在adult数据集上的实现
- 用各种机器学习方法knn,随机森林,
- 树叶数据集
评论
共有 条评论