资源简介

B站的唐宇迪深度学习项目实战附带的自然语言处理word2vec代码。Word2vec,是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。训练完成之后,word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。

资源截图

代码片段和文件信息

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     目录           0  2016-11-13 09:19  kaggle-word2vec\data\
     文件    33556378  2014-07-31 01:17  kaggle-word2vec\data\labeledTrainData.tsv
     文件      282796  2016-11-13 09:10  kaggle-word2vec\data\sampleSubmission.csv
     文件    32724746  2014-07-31 01:17  kaggle-word2vec\data\testData.tsv
     文件    67281491  2014-07-31 01:17  kaggle-word2vec\data\unlabeledTrainData.tsv
     目录           0  2017-08-11 14:11  kaggle-word2vec\models\
     文件    44981600  2017-08-11 15:00  kaggle-word2vec\models\300features_40minwords_10context.model
     目录           0  2017-08-15 21:17  kaggle-word2vec\notebooks\
     目录           0  2017-08-15 19:29  kaggle-word2vec\notebooks\.ipynb_checkpoints\
     文件       10758  2016-11-13 10:13  kaggle-word2vec\notebooks\.ipynb_checkpoints\2.word2vec modeling-checkpoint.ipynb
     文件       49823  2016-11-13 16:12  kaggle-word2vec\notebooks\.ipynb_checkpoints\3. word2vec and classifiers modeling-checkpoint.ipynb
     文件       25693  2016-11-13 10:08  kaggle-word2vec\notebooks\.ipynb_checkpoints\word2vec-checkpoint.ipynb
     文件       94256  2017-08-15 21:17  kaggle-word2vec\notebooks\word2vec.ipynb
     文件        7528  2016-11-13 09:58  kaggle-word2vec\stopwords.txt

评论

共有 条评论