BoW（Bag of Words）词袋模型.zip

大小: 117.35MB

文件类型: .zip

金币: 2

下载: 1 次

发布日期: 2023-01-16
语言: 其他
标签: bow python

高速下载

资源简介

本demo实现的是基于bow原理对图片进行分类，并实现对选取得测试集进行查找 BoW(Bag of Words)词袋模型最初被用在文本分类中，将文档表示成特征矢量。它的基本思想是假定对于一个文本，忽略其词序和语法、句法，仅仅将其看做是一些词汇的集合，而文本中的每个词汇都是独立的。简单说就是讲每篇文档都看成一个袋子（因为里面装的都是词汇，所以称为词袋，Bag of words即因此而来），然后看这个袋子里装的都是些什么词汇，将其分类。如果文档中猪、马、牛、羊、山谷、土地、拖拉机这样的词汇多些，而银行、大厦、汽车、公园这样的词汇少些，我们就倾向于判断它是一篇描绘乡村的文档，而不是描述城镇的。 serachFeatures.py中，前面主要是一些通过parse使得可以在敲命令行的时候可以向里面传递参数，后面就是提取SIFT特征，然后聚类，计算TF和IDF，得到单词直方图后再做一下L2归一化。一般在一幅图像中提取的到SIFT特征点是非常多的，而如果图像库很大的话，SIFT特征点会非常非常的多，直接聚类是非常困难的(内存不够，计算速度非常慢)，所以，为了解决这个问题，可以以牺牲检索精度为代价，在聚类的时候先对SIFT做降采样处理。最后对一些在在线查询时会用到的变量保存下来。对于某个图像库，我们可以在命令行里通过下面命令生成BoF。 query.py只能每次查找一张图片，并返回与之匹配度（递减）最接近的6张图片

资源截图

小图大图

代码片段和文件信息

上一篇：HCIE-R&S培训材料和实验手册.zip
下一篇：UTM.ipaios平台用的虚拟机

共有条评论

BoW（Bag of Words）词袋模型.zip

资源简介

资源截图

代码片段和文件信息

评论

相关资源