资源简介

Word2vec 支持多种单词相似度任务;既可以计算词汇相似度,也可以计算句子相似度。功能强大,简单易学!

资源截图

代码片段和文件信息

from gensim.models import KeyedVectors

class Word2Vec():
  def __init__(self modelPath kind=‘bin‘):
    “““
    创建Word2Vec对象
    
    modelPath: 模型路径
    kind: 模型类型
      bin: 二进制文件
      txt: 文本文件
    return: 无
    “““
    
    if kind != ‘bin‘:
      kind = False
    else:
      kind = True
    print(‘loading word2vector model...‘)
    self.model = KeyedVectors.load_word2vec_format(modelPath binary=kind unicode_errors=‘ignore‘)
  
  def get_word_vector(self word):
    “““
    获得词向量
    
    word: 词语
    return: 词向量
    “““
    
    if word in self.model:
      return self.model[word]
    return None
    
  def word_similarity(self word1 word2):
    “““
    计算词语相似度
    
    word1: 词语1
    word2: 词语2
    return: 词语1与词语2的相似度
    “““
    
    if word1 not in self.model or word2 not i

评论

共有 条评论

相关资源