资源简介
Word2vec 支持多种单词相似度任务;既可以计算词汇相似度,也可以计算句子相似度。功能强大,简单易学!
代码片段和文件信息
from gensim.models import KeyedVectors
class Word2Vec():
def __init__(self modelPath kind=‘bin‘):
“““
创建Word2Vec对象
modelPath: 模型路径
kind: 模型类型
bin: 二进制文件
txt: 文本文件
return: 无
“““
if kind != ‘bin‘:
kind = False
else:
kind = True
print(‘loading word2vector model...‘)
self.model = KeyedVectors.load_word2vec_format(modelPath binary=kind unicode_errors=‘ignore‘)
def get_word_vector(self word):
“““
获得词向量
word: 词语
return: 词向量
“““
if word in self.model:
return self.model[word]
return None
def word_similarity(self word1 word2):
“““
计算词语相似度
word1: 词语1
word2: 词语2
return: 词语1与词语2的相似度
“““
if word1 not in self.model or word2 not i
评论
共有 条评论