资源简介

这是《Python数据挖掘课程》系列文章,前面很多文章都讲解了分类、聚类算法,而这篇文章主要讲解如何调用SnowNLP库实现情感分析,处理的对象是豆瓣《肖申克救赎》的评论文本。文章比较基础,希望对你有所帮助,提供些思路,也是自己教学的内容。如果文章中存在错误或不足之处,还请海涵。同时,推荐大家阅读我以前的文章了解其他知识。 --------------------- 作者:Eastmount 来源:CSDN 原文:https://blog.csdn.net/Eastmount/article/details/85118818 版权声明:本文为博主原创文章,转载请附上博文链接!

资源截图

代码片段和文件信息

# coding=utf-8  
from selenium import webdriver  
from selenium.webdriver.common.keys import Keys  
import selenium.webdriver.support.ui as ui  
from selenium.webdriver.common.action_chains import ActionChains  
import time      
import re      
import os
import csv

#打开Firefox浏览器
driver = webdriver.Firefox()
i = 0
while i<1:
    num = i*20
    url = “https://movie.douban.com/subject/1292052/comments?start=“ + str(num) +“&limit=20&sort=new_score&status=P“
    print url
    driver.get(url)
    #用户姓名 超链接
    elem1 = driver.find_elements_by_xpath(“//div[@class=‘avatar‘]/a“)
    for n in elem1:
        print n.get_attribute(“title“) 
        print n.get_attribute(“href“)
        
    #用户评分
    elem2 = driver.find_elements_by_xpath(“//span[@class=‘comment-info‘]/span[2

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件       1394  2018-12-20 15:06  2018-12-20 情感分析\1.test-douban.py

     文件       2549  2018-12-20 16:29  2018-12-20 情感分析\2.test-douban2.py

     文件        592  2018-12-20 16:59  2018-12-20 情感分析\3.test-fenci.py

     文件        269  2018-12-21 09:43  2018-12-20 情感分析\4.test-snownlp01.py

     文件        718  2018-12-21 10:22  2018-12-20 情感分析\5.test-snownlp02.py

     文件        348  2018-12-21 10:37  2018-12-20 情感分析\6.test-snownlp03.py

     文件        520  2018-12-21 11:00  2018-12-20 情感分析\7.test-snownlp04.py

     文件        655  2018-12-21 11:10  2018-12-20 情感分析\8.test-snownlp05.py

     文件      28795  2018-12-20 16:37  2018-12-20 情感分析\data.txt

     文件      47753  2018-12-20 16:29  2018-12-20 情感分析\test-douban.csv

     目录          0  2018-12-21 11:01  2018-12-20 情感分析

----------- ---------  ---------- -----  ----

                83593                    11


评论

共有 条评论