• 大小: 0.36M
    文件类型: .zip
    金币: 2
    下载: 2 次
    发布日期: 2021-03-28
  • 语言: 其他
  • 标签: 其他  

资源简介


词语相似度计算,语义计算,用于人工智能,自然语言处理,数据挖掘,舆情分析等众多领域。

资源截图

代码片段和文件信息

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
#
# Copyright (C) 2016 ashengtx 
# under MIT License

import math


class CilinSimilarity(object):
    “““
    基于哈工大同义词词林扩展版计算语义相似度
    “““
    def __init__(self):
        “““
        ‘code_word‘ 以编码为key,单词list为value的dict,一个编码有多个单词
        ‘word_code‘ 以单词为key,编码为value的dict,一个单词可能有多个编码
        ‘vocab‘ 所有的单词
        ‘N‘ N为单词总数,包括重复的词
        “““
        self.a = 0.65
        self.b = 0.8
        self.c = 0.9
        self.d = 0.96
        self.e = 0.5
        self.f = 0.1
        self.degree = 180
        self.PI = math.pi
        self.code_word = {}
        self.word_code = {}
        self.vocab = set()
        self.N = 0
        self.read_cilin()

    def read_cilin(self):
        “““
        读入同义词词林,编码为key,词群为value,保存在self.code_word
        单词为key,编码为value,保存在self.word_code
        所有单词保存在self.vocab
        “““
        with open(‘../data/cilin.txt‘ ‘r‘ encoding=‘gbk‘) as f:
            for line in f.readlines():
       

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2017-06-27 10:09  CilinSimilarity-master\
     文件        1065  2017-06-27 10:09  CilinSimilarity-master\LICENSE
     文件        2074  2017-06-27 10:09  CilinSimilarity-master\README.md
     目录           0  2017-06-27 10:09  CilinSimilarity-master\data\
     文件      678557  2017-06-27 10:09  CilinSimilarity-master\data\cilin.txt
     目录           0  2017-06-27 10:09  CilinSimilarity-master\source\
     文件       13557  2017-06-27 10:09  CilinSimilarity-master\source\cilin.py

评论

共有 条评论