资源简介
python机器学习中文情感分析代码(语料库 特征库 停用词 源码),基于酒店评论语料库机器学习
代码片段和文件信息
#!/usr/bin/env python
# coding: utf-8
import pandas as pd
import numpy as np
import sklearn
from pandas import Dataframe Series
df = pd.read_csv(‘data.csv‘ encoding=‘gb18030‘)
# In[8]:
df.head()
# print(df.head())
# In[ ]:
df.shape
print(df.shape)
# In[ ]:
def make_label(df):
df[“sentiment“] = df[“star“].apply(lambda x: 1 if x>3 else 0)
# In[ ]:
make_label(df)
# In[ ]:
df.head()
print(df.head())
# In[ ]:
X = df[[‘comment‘]]
y = df.sentiment
# In[ ]:
X.shape
# In[ ]:
y.shape
# In[ ]:
X.head()
# In[ ]:
import jieba
# In[ ]:
def chinese_word_cut(mytext):
return “ “.join(jieba.cut(mytext))
# In[ ]:
X[‘cutted_comment‘] = X.comment.apply(chinese_word_cut)
# In[ ]:
X.cutted_comment[:5]
# In[ ]:
from sklearn.model_selection import train_
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 9893 2020-06-02 23:15 demo\.ipynb_checkpoints\demo-checkpoint.ipynb
文件 3607 2020-06-02 23:55 demo\.ipynb_checkpoints\demo-checkpoint.py
文件 364905 2020-06-02 23:15 demo\data.csv
文件 48129 2020-06-04 22:21 demo\demo.ipynb
文件 3607 2020-06-02 23:55 demo\demo.py
文件 1411 2020-06-02 23:15 demo\environment.yaml
文件 1119 2020-06-04 23:11 demo\sentiment.marshal.3
文件 157 2020-06-02 23:15 demo\stopwordsHIT.txt
目录 0 2020-06-03 21:21 demo\.ipynb_checkpoints
目录 0 2020-06-04 23:10 demo
----------- --------- ---------- ----- ----
432828 10
相关资源
- python一个打砖块的小游戏
- python实验指导书 图文高清版
- python主动安装第三方库
- python爬取豆瓣top250电影信息
- python绘制 大蟒蛇
- python小程序(数组排序)
- Python去水印(基于cv2)
- Python 数据结构入门 - 二叉搜索树(
- python空心电感计算器
- python除法.docx
- 抽奖背后的秘密(python抽奖逻辑)
- 绘制统计学直方图茎叶图(matplotlib)
- python求解标准差
- python数据分析与处理
- 利用Python将照片在Excel中利用点阵图显
- python turtle 跳房子
- python 人群计数
- Python调用第三方API换脸
- “去哪儿吃”帮你选餐厅(python代码
- python 控制台登陆密码验证
- KNN算法的Python实现(datingrecd.ipynb)
- python核心编程第二版-习题答案
- python爬取笔趣阁小说
- Python程序设计基础试题以及答案(3
- python聊天-服务端与客户端
- python递归求最大公约数
- 用python画皮卡丘(基于turtle)
- 伟哥的python私房菜(中国程序员).
- pip一键升级(python脚本)
- 我的世界python编程——天空行走py格式
评论
共有 条评论