资源简介
词语相似度计算,语义计算,用于人工智能,自然语言处理,数据挖掘,舆情分析等众多领域。
代码片段和文件信息
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
#
# Copyright (C) 2016 ashengtx
# under MIT License
import math
class CilinSimilarity(object):
“““
基于哈工大同义词词林扩展版计算语义相似度
“““
def __init__(self):
“““
‘code_word‘ 以编码为key,单词list为value的dict,一个编码有多个单词
‘word_code‘ 以单词为key,编码为value的dict,一个单词可能有多个编码
‘vocab‘ 所有的单词
‘N‘ N为单词总数,包括重复的词
“““
self.a = 0.65
self.b = 0.8
self.c = 0.9
self.d = 0.96
self.e = 0.5
self.f = 0.1
self.degree = 180
self.PI = math.pi
self.code_word = {}
self.word_code = {}
self.vocab = set()
self.N = 0
self.read_cilin()
def read_cilin(self):
“““
读入同义词词林,编码为key,词群为value,保存在self.code_word
单词为key,编码为value,保存在self.word_code
所有单词保存在self.vocab
“““
with open(‘../data/cilin.txt‘ ‘r‘ encoding=‘gbk‘) as f:
for line in f.readlines():
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2017-06-27 10:09 CilinSimilarity-master\
文件 1065 2017-06-27 10:09 CilinSimilarity-master\LICENSE
文件 2074 2017-06-27 10:09 CilinSimilarity-master\README.md
目录 0 2017-06-27 10:09 CilinSimilarity-master\data\
文件 678557 2017-06-27 10:09 CilinSimilarity-master\data\cilin.txt
目录 0 2017-06-27 10:09 CilinSimilarity-master\source\
文件 13557 2017-06-27 10:09 CilinSimilarity-master\source\cilin.py
- 上一篇:毕业设计选题管理系统
- 下一篇:截图工具(仿QQ截图大致功能都已实现)
相关资源
- 通过变化的电磁耦合,大型强子对撞
- Delphi XE10.3 破解文件
- Delphi XE10.2.3破解 破解
- 剖析Linux系统下基于NUMA构建的服务
- zend studio 12 破解 注册码 key 绿色版
- CCLicenseService
- WinRAR 4.0 简体中文破解版
- 单片机仿真软件proteus6.7免安装绿色版
- UltraEdit 26.x版本 激活工具
- 一种基于LM3150 Buck型开关电源设计.p
- 百度文库、豆丁、道客巴巴文件免费
- 改善分数分频锁相环合成器中的整数
- 233网校视频器2018最新绿色版
- OdooHotelManagementSystem 基于Odoo的酒店管
- SecureCRT-6.0.2安装包和SecureCRT-6.0.2注册
- 数据结构与算法课件ppt
- 方正超粗黑简体 FZCCHJW—GB1-0 字体
- FZCCHJW-GB10
- Dr. Cleaner Pro mac破解版
- kindle epub 电子书大全
- 迅雷敏感资源限制解除小工具.zip
- Eclipse编程技术与附CD-ROM光盘
- HEU_KMS_Activator_j
- pzs_44217116_06.aia
- Git汉化资源
- digital字体
- 浪潮英信服务器NP120D用户手册
- 看门狗复位的应用技巧
- Hillstone SA-2003高性能纯硬件安全网关产
- Hillstone ARP防护——StoneOS如何保
评论
共有 条评论