资源简介
ngramScore适应度计算文件(包含引入的计算代码和分词),python支持的适应度计算导入文件
代码片段和文件信息
‘‘‘
Allows scoring of text using n-gram probabilities
17/07/12
‘‘‘
from math import log10
class ngram_score(object):
def __init__(selfngramfilesep=‘ ‘):
‘‘‘ load a file containing ngrams and counts calculate log probabilities ‘‘‘
self.ngrams = {}
for line in file(ngramfile):
keycount = line.split(sep)
self.ngrams[key] = int(count)
self.L = len(key)
self.N = sum(self.ngrams.itervalues())
#calculate log probabilities
for key in self.ngrams.keys():
self.ngrams[key] = log10(float(self.ngrams[key])/self.N)
self.floor = log10(0.01/self.N)
def score(selftext):
‘‘‘ compute the score of text ‘‘‘
score = 0
ngrams = self.ngrams.__getitem__
for i in xrange(len(text)-self.L+1):
if text[i:i+self.L] in self.ngrams: score += ngrams(text[i:i+self.L])
else: score += self.floor
return score
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 0 2020-01-13 02:40 閫傚簲搴﹁绠?
文件 6148 2020-01-13 02:40 閫傚簲搴﹁绠?.DS_Store
文件 120 2020-01-13 02:40 __MACOSX\閫傚簲搴﹁绠?._.DS_Store
文件 972 2019-11-29 01:12 閫傚簲搴﹁绠?ngram_score.py
文件 975928 2019-11-29 01:08 閫傚簲搴﹁绠?english_quadgrams.txt.zip
文件 591 2019-11-29 01:08 __MACOSX\閫傚簲搴﹁绠?._english_quadgrams.txt.zip
- 上一篇:多标签数据集.zip
- 下一篇:python习题
相关资源
- python习题
- 爱鲜蜂项目源码
- python300G视频书籍教程.zip
- Python点餐案例
- apriori python 3
- Python-Django搭建简单网站源码
- PSO优化的BP神经网络——python实现
- 基于Python专业网络爬虫的设计与实现
- 爬虫视频案例课程----崔庆财
- 漏洞验证脚本ssl-deacth-alert(cve-2016-
- 后台管理系统 v1.0.0
- python获取城市各公交线路及公交站点
- 麦子学院Python视频.txt
- starfm算法实现
- PYQT5+图片拖拽
- python+sqlite学生成绩管理
- Python手势识别与控制源码
- Programming Python-Python编程第4版-上下册
- python3-bayes朴素贝叶斯
- 最近邻kNN-python3源码和数据
- 安装包feedparser-5.2.1
- python腾讯文字识别 OCR脚本
- python词云源码
- 多元线性回归预测房价算法pythons实现
- 笨方法学pythonLearn Python the Hard Way中文
- python编写2048小游戏
- 上交软院2017、2018年机试题目及代码
- 小猪佩奇学习代码
- 二元有限域矩阵的秩的计算 python语言
- month2day.py
评论
共有 条评论