-
大小: 4KB文件类型: .py金币: 1下载: 0 次发布日期: 2021-01-03
- 语言: Python
- 标签:
资源简介
最新的词语相似度计算方法;基于词林和知网的词语相似度计算;版权归原作者所有,仅供学习交流使用;
代码片段和文件信息
# -*- coding: utf-8 -*-
‘‘‘
@author: yaleimeng@sina.com
@license: (C) Copyright 2017
@desc: 混合采用词林和知网的相似度计算方法。得到更加符合人们感觉的相似度数值。
@DateTime: Created on 2018/1/25 at 上午 08:59 by PyCharm ‘‘‘
from hownet.howNet import How_Similarity
from cilin.ciLin import CilinSimilarity
class HybridSim():
‘‘‘
混合相似度计算策略。使用了词林与知网词汇量的并集。扩大了词汇覆盖范围。
‘‘‘
ci_lin = CilinSimilarity() # 实例化词林相似度计算对象
how_net = How_Similarity() # 实例化知网相似度计算对象
Common = ci_lin.vocab & how_net.vocab
A = how_net.vocab - ci_lin.vocab
B = ci_lin.vocab - how_net.vocab
@classmethod
def get_Final_sim(cls w1 w2):
lin = cls.ci_lin.sim2016(w1 w2) if w1 in cls.ci_lin.vocab and w2 in cls.ci_lin.vocab else 0
how = cls.how_net.calc(w1 w2) if w1 in cls.how_net.voca
评论
共有 条评论