资源简介
数据集为依据与“新冠肺炎”相关的230个主题关键词进行随机数据采集的2020年1月1日—2020年2月20日期间共计100万条微博数据,公开数据集:
其中每列的含义:
- id: 微博序号,主键
- weibo_id: 微博id
- daytime: 微博发布时间, 从0000-2359
- name:发布人账号
- content:微博中文内容
- day:日期
- month:月份
- sentiments:使用snowNLP分析得出的情感数值,范围为-0.5 ~ 0.5,大于0为正面情感,小于0为负面情感;
- keyword0-4:使用jieba分词提取的主题关键词,取前四位;
使用该数据集进行的可视化分析实现:http://flask.yunwei123.tech/
github地址:https://github.com/yunwei37/COVID-19-NLP-vis
代码片段和文件信息
相关资源
- 基于.NET+sqlserver的简易微博
- 豆瓣影评数据集
- 仿新浪微博数据库+存储过程+asp.net 源
- asp.net实现的简单微博系统,vs2005+Sq
- asp.net在线微博系统
- 新浪微博点赞关注评论(C#源码)
- C#ASP_NET仿新浪微博客V2
- 基于ASP.NET的微博系统
- 基于asp.net和MVC三层架构的小型微博网
- 基于NLPIR(ICTCLAS2013)的中文分词C#
- asp.net mvc 微博源码
- asp.net微博系统
- 仿新浪微博的网站源码232473
- 仿新浪微博的网站源码
- 疫情期间民众微博数据
- GeckoFX 火狐内核C#新浪微博Cookie读取
- 微博数据复杂网络用不了,主要转发
- ASP.NET下Sina跟QQ的登录接口调用源代码
- 抓取新浪微博好友动态(可参考读取
- 负面词汇情感分类.csv
- OAuth2 通用组件(支持新浪微博、QQ、
- C#生成新浪微博短网址
- QQ在线客服源码
- 新浪微博OAuth第三方登录
评论
共有 条评论