资源简介
1、掌握选择term的方法;
2、权重计算(TermWeighting):即计算每篇文 权重计算(Term Weighting):即计算每篇文 档中每个term的权重,计算TF、IDF;
3、查询和文档的相似度计算(Siili • 查询和文档的相似度计算(Similarity Computation)。
代码片段和文件信息
// stdafx.cpp : 只包括标准包含文件的源文件
// VSM.pch 将作为预编译头
// stdafx.obj 将包含预编译类型信息
#include “stdafx.h“
// TODO: 在 STDAFX.H 中引用任何所需的附加头文件,
//而不是在此文件中引用
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 2883584 2017-05-22 19:44 VSM-YYC\ipch\vsm-ecba59c9\vsm-6b86ff20.ipch
文件 2777 2016-05-14 21:56 VSM-YYC\VSM\Chinese-StopWords.txt
文件 144527 2017-05-09 15:22 VSM-YYC\VSM\input.txt
文件 1414 2017-05-16 15:07 VSM-YYC\VSM\kmeans.txt
文件 1482 2017-05-09 14:43 VSM-YYC\VSM\ReadMe.txt
文件 207 2017-05-09 14:43 VSM-YYC\VSM\stdafx.cpp
文件 234 2017-05-09 14:43 VSM-YYC\VSM\stdafx.h
文件 240 2017-05-09 14:43 VSM-YYC\VSM\targetver.h
文件 5092 2017-05-16 15:06 VSM-YYC\VSM\VSM.cpp
文件 8053 2017-05-16 11:20 VSM-YYC\VSM\VSM.vcxproj
文件 1310 2017-05-09 14:43 VSM-YYC\VSM\VSM.vcxproj.filters
文件 343024 2017-05-16 15:07 VSM-YYC\VSM\所有文本之间的相似度.txt
文件 504 2017-05-16 15:07 VSM-YYC\VSM\相似度大于定值的文本.txt
文件 8519680 2017-05-22 19:44 VSM-YYC\VSM.sdf
文件 1291 2017-05-09 14:43 VSM-YYC\VSM.sln
..A..H. 13824 2017-05-22 19:44 VSM-YYC\VSM.v12.suo
目录 0 2017-05-22 19:44 VSM-YYC\ipch\vsm-ecba59c9
目录 0 2017-05-22 19:44 VSM-YYC\ipch
目录 0 2017-05-18 21:15 VSM-YYC\VSM
目录 0 2017-05-22 19:44 VSM-YYC
----------- --------- ---------- ----- ----
11927243 20
评论
共有 条评论