# -*- coding: utf-8 -*-i
import sys
import json
from smallseg import SEG
seg = SEG()
def loadDict(fileName score):
wordDict = {}
with open(fileName) as fin:
for line in fin:
word = line.strip()
wordDict[word] = score
return wordDict
def appendDict(wordDict fileName score):
with open(fileName) as fin:
for line in fin:
word = line.strip()
wordDict[word] = score
def loadExtentDict(fileName):
extentDict = {}
for i in range(6):
with open(fileName + str(i + 1) + “.txt“) as fin :
for line in fin:
word = line.strip()
extentDict[word] = i + 1
return extentDict
postDict = loadDict(u“sentimentDict/正面情感词语(中文).txt“ 1)
appendDict(postDict u“sentimentDict/正面评价词语(中文).txt“ 1)
appendDict(postDict u“sentimentDict/正面评价词语(中文)1.txt“ 1)
appendDict(postDict u“sentimentDict/正面评价词语(中文)2.txt“ 1)
negDict = loadDict(u“sentimentDict/负面情感词语(中文).txt“ -1)
appendDict(negDict u“sentimentDict/负面评价词语(中文).txt“ -1)
extentDict = loadExtentDict(u“sentimentDict/程度级别词语(中文)“)
inverseDict = loadDict(u“sentimentDict/否定词语.txt“ -1)
punc = loadDict(u“sentimentDict/标点符号.txt“ 1)
exclamation = {“!“:2 “!“:2}
for line in sys.stdin:
line = line.strip()
record = json.loads(line[1:-1])
key = record[“weiboId“]
content = record[“content“]
wordList = seg.cut(content)
lastWordPos = 0
lastPuncPos = 0
i = 0
for word in wordList:
word = word.encode(“utf-8“)
if word in punc:
lastPuncPos = i
if word in postDict:
if lastWordPos > lastPuncPos:
start = lastWordPos
start = lastPuncPos
score = 1
#print “start: “ + str(start)
#print “end: “ + str(i)
for word_before in wordList[start:i]:
word_before = word_before.encode(“utf-8“)
if word_before in extentDict:
score = score * extentDict[word_before]
if word_before in inverseDict:
score = score * -1
for word_after in wordList[i+1:]:
word_after = word_after.encode(“utf-8“)
if word_after in punc:
if word_after in exclamation:
score = score + 2
#print ‘%s\t%s\t%s‘ % (key word score)
print ‘%s\t%s‘ % (key score)
lastWordPos = i
elif word in negDict:
if lastWordPos > lastPuncPos:
start = lastWordPos
start = lastPuncPos
score = -1
#print “start: “ + str(start)
#print “end: “ + str(i)
for word_before in wordList[start:i]:
word_before = word_before.encode(“utf-8“)
if word_before in extentDict:
score = score * extentDict[word_before]
if word_before in inverseDict:
score = score * -1
for word_after in wordList[i+1:]:
word_after = word_after.encode(“utf-8“)
if word_after in punc:
if word_after in exclamation:
score = score - 2
#print ‘%s\t%s\t%s‘ % (key word score)
print ‘%s\t%s‘ % (key score)
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 207606 2015-12-24 22:37 基于情感词典进行情感分析\10000+运行结果.txt
文件 3184 2015-12-24 00:01 基于情感词典进行情感分析\mapper.py
文件 391 2015-12-24 00:01 基于情感词典进行情感分析\reducer.py
文件 289 2015-12-19 21:52 基于情感词典进行情感分析\情感词典\主张词语(中文).txt
文件 140 2015-12-19 22:14 基于情感词典进行情感分析\情感词典\否定词语.txt
文件 5 2015-12-22 19:24 基于情感词典进行情感分析\情感词典\感叹号.txt
文件 6252 2015-12-19 21:51 基于情感词典进行情感分析\情感词典\正面情感词语(中文).txt
文件 30384 2015-12-19 21:51 基于情感词典进行情感分析\情感词典\正面评价词语(中文).txt
文件 15905 2015-12-19 21:51 基于情感词典进行情感分析\情感词典\正面评价词语(中文)1.txt
文件 14973 2015-12-19 21:51 基于情感词典进行情感分析\情感词典\正面评价词语(中文)2.txt
文件 72 2015-12-19 21:49 基于情感词典进行情感分析\情感词典\程度级别1词语(中文).txt
文件 174 2015-12-19 21:49 基于情感词典进行情感分析\情感词典\程度级别2词语(中文).txt
文件 224 2015-12-19 21:50 基于情感词典进行情感分析\情感词典\程度级别3词语(中文).txt
文件 218 2015-12-19 21:50 基于情感词典进行情感分析\情感词典\程度级别4词语(中文).txt
文件 170 2015-12-19 21:50 基于情感词典进行情感分析\情感词典\程度级别5词语(中文).txt
文件 430 2015-12-19 21:50 基于情感词典进行情感分析\情感词典\程度级别6词语(中文).txt
文件 9927 2015-12-19 21:51 基于情感词典进行情感分析\情感词典\负面情感词语(中文).txt
文件 26076 2015-12-19 21:51 基于情感词典进行情感分析\情感词典\负面评价词语(中文).txt
文件 88 2015-12-24 23:10 基于情感词典进行情感分析\结果汇总.txt
目录 0 2016-01-11 23:38 基于情感词典进行情感分析\情感词典
目录 0 2016-01-11 23:39 基于情感词典进行情感分析
----------- --------- ---------- ----- ----
316508 21
- 上一篇:逐像元趋势分析+F值检验
- 下一篇:python音乐源代码
- python实现SGBM图像匹配算法
- python实现灰度直方图均衡化
- scrapy_qunar_one
- Python学习全系列教程永久可用
- python简明教程.chm
- 抽奖大转盘python的图形化界面
- 双边滤波器实验报告及代码python
- python +MYSQL+HTML实现21蛋糕网上商城
- Python-直播答题助手自动检测出题搜索
- OpenCV入门教程+OpenCV官方教程中文版
- Python 串口工具源码+.exe文件
- Python开发的全栈股票系统.zip
- Python操作Excel表格并将其中部分数据写
- python书籍 PDF
- 利用python绘制散点图
- python+labview+No1.vi
- 老男孩python项目实战
- python源码制作whl文件.rar
- python3.5可用的scipy
- PYTHON3 经典50案例.pptx
- 计算机科学导论-python.pdf
- python模拟鼠标点击屏幕
- windows鼠标自动点击py脚本
- 鱼c小甲鱼零基础学python全套课后题和
- Python 练习题100道
- Practical Programming 2nd Edition
- wxPython Application Development Cookbook
- python 3.6
- Python 3.5.2 中文文档 互联网唯一CHM版本
- python3.5.2.chm官方文档
共有 条评论