资源简介
NLP之旅(包含NLP文章/代码集锦)
代码片段和文件信息
import keras
from .word_embeddings import Wordembeddings
from .glove import GloVeembeddings
‘‘‘
Source: https://github.com/rgsachin/CoVe
‘‘‘
class CoVeembeddings(Wordembeddings):
COVE_MODEL_KERAS_URL = ‘https://github.com/rgsachin/CoVe/raw/master/Keras_CoVe.h5‘
def __init__(self
word_embeddings_dir
handle_oov=True oov_vector_type=‘random‘
padding=True pad_vector_type=‘random‘
max_sequence_length=50 tokenizer=None
verbose=0):
super().__init__(verbose=verbose)
if tokenizer is None:
self.tokenizer = self._tokenizer_space
self.word_embeddings_dir = word_embeddings_dir
self.handle_oov = handle_oov
self.oov_vector_type = oov_vector_type
self.padding = padding
self.pad_vector_type = pad_vector_type
self.max_sequence_length = max_sequence_length
def load_model(self dest_dir src=None trainable=True verbose=0):
if src is None:
src = self.COVE_MODEL_KERAS_URL
file_path = self.download(
src=src dest_dir=dest_dir dest_file=None uncompress=False)
self.model = keras.models.load_model(file_path)
self.word_embs_model = GloVeembeddings(
handle_oov=self.handle_oov oov_vector_type=self.oov_vector_type
padding=self.padding pad_vector_type=self.pad_vector_type
max_sequence_length=self.max_sequence_length)
self.word_embs_model.load_model(dest_dir=self.word_embeddings_dir process=False verbose=verbose)
def encode(self x tokenize=True):
if tokenize:
tokens = [self.tokenizer(sentence) for sentence in x]
else:
tokens = x
x_embs = self.word_embs_model.encode(tokens)
return self.model.predict(x_embs)
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2019-07-30 04:44 nlp-master\
文件 5 2019-07-30 04:44 nlp-master\.gitignore
文件 15499 2019-07-30 04:44 nlp-master\README.md
目录 0 2019-07-30 04:44 nlp-master\aion\
目录 0 2019-07-30 04:44 nlp-master\aion\em
文件 1961 2019-07-30 04:44 nlp-master\aion\em
文件 2877 2019-07-30 04:44 nlp-master\aion\em
文件 838 2019-07-30 04:44 nlp-master\aion\em
文件 4723 2019-07-30 04:44 nlp-master\aion\em
文件 3042 2019-07-30 04:44 nlp-master\aion\em
文件 2797 2019-07-30 04:44 nlp-master\aion\em
文件 2746 2019-07-30 04:44 nlp-master\aion\em
目录 0 2019-07-30 04:44 nlp-master\aion\em
文件 83 2019-07-30 04:44 nlp-master\aion\em
文件 19332 2019-07-30 04:44 nlp-master\aion\em
文件 8103 2019-07-30 04:44 nlp-master\aion\em
文件 3175 2019-07-30 04:44 nlp-master\aion\em
目录 0 2019-07-30 04:44 nlp-master\aion\em
文件 1969 2019-07-30 04:44 nlp-master\aion\em
文件 2192 2019-07-30 04:44 nlp-master\aion\em
目录 0 2019-07-30 04:44 nlp-master\aion\em
文件 48444 2019-07-30 04:44 nlp-master\aion\em
文件 2602 2019-07-30 04:44 nlp-master\aion\em
文件 12 2019-07-30 04:44 nlp-master\aion\em
文件 580976 2019-07-30 04:44 nlp-master\aion\em
文件 32989 2019-07-30 04:44 nlp-master\aion\em
文件 2517 2019-07-30 04:44 nlp-master\aion\em
文件 11112 2019-07-30 04:44 nlp-master\aion\em
文件 838 2019-07-30 04:44 nlp-master\aion\em
文件 4872 2019-07-30 04:44 nlp-master\aion\em
文件 1682 2019-07-30 04:44 nlp-master\aion\em
............此处省略39个文件信息
相关资源
- Python-python3实现互信息和左右熵的新词
- Python-全唐诗分析程序
- Python-pycorrector中文错别字纠正工具音
- Python-对四种句子文本相似度计算方法
- Python-爬取百度百科中文页面抽取三元
- Python-CCKS2017中文电子病例命名实体识
- Python-流行BERT模型的一个简单而完整的
- Python-这是GoogleBERT模型的一个Pytorch重
- Python-深度学习与自然语言处理知识图
- Python-利用Python实现中文文本关键词抽
- Python-2019年百度的三元组抽取比赛一个
- Python-基于TensorFlow和BERT的管道式实体
评论
共有 条评论