资源简介
常用内部(Sil,CH,DBI,KL)、外部评价指标(Rand等4个),用自带样本集“leuk72_3k.txt”测试可用!
代码片段和文件信息
function result = daisy(xvtypemetric)
%DAISY returns a matrix containing all the pairwise dissimilarities
%(distances) between observations in the dataset. The original
%variables may be of mixed types.
%
%The calculation of dissimilarities is explained in:
% Kaufman L. and Rousseeuw P.J. (1990)
% “Finding groups in data: An introduction to cluster analysis“
% Wiley-Interscience: New York (Series in Applied Probability and
% Statistics) ISBN 0-471-87876-6.
%
% Required input arguments:
% x : Data matrix (rows = observations columns = variables)
% vtype : Variable type vector (length equals number of variables)
% Possible values are 1 Asymmetric binary variable (0/1)
% 2 Nominal variable (includes symmetric binary)
% 3 Ordinal variable
% 4 Interval variable
%
% Optional input arguments:
% metric : Metric to be used (default euclidian (eucli) or mixed (mixed))
% Possible values are ‘eucli‘ Euclidian (all interval variables)
% ‘manha‘ Manhattan
% ‘mixed‘ Mixed (not all interval variables)
%
% I/O:
% result=daisy(xvtype‘eucli‘)
%
% Example (subtracted from the referenced book)
% load flower.mat
% result=daisy(flower[2 2 1 2 3 3 4]);
%
% The output of DAISY is a structure containing:
% result.disv : dissimilarities (read row by row from the
% lower dissimilarity matrix)
% result.metric : used metric
% result.number : number of observations
%
% This function is part of LIBRA: the Matlab Library for Robust Analysis
% available at:
% http://wis.kuleuven.be/stat/robust.html
%
% Written by Guy Brys and Wai Yan Kong (May 2006)
%Checking and filling in the inputs
if (nargin<2)
error(‘Two input arguments required‘)
elseif (nargin<3)
if (sum(vtype)~=4*size(x2))
metric = ‘mixed‘;
metr = 0;
else
metric = ‘eucli‘;
metr = 1;
end
elseif (nargin==3)
if strcmp(metric‘eucli‘)
metr=1;
elseif strcmp(metric‘manha‘)
metr=2;
elseif strcmp(metric‘mixed‘)
metr=0;
end
end
%Standardizing in case of mixed metric
if (sum(vtype)~=4*size(x2))
colmin = min(x);
colextr = max(x)-colmin;
x = (x - repmat(colminsize(x1)1))./repmat(colextrsize(x1)1);
end
%Replacement of missing values
jtmd = repmat(11size(x2))-2*(sum(isnan(x))>0);
valmisdat = min(min(x))-0.5;
x(isnan(x)) = valmisdat;
valmd = repmat(valmisdat1size(x2));
%Actual calculations
disv=daisyc(size(x1)size(x2)xvalmdjtmdvtypemetr);
%Putting things together
result = struct(‘disv‘disv‘metric‘metric‘number‘size(x1));
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 20688 2018-10-28 19:36 聚类有效性指标(4内4外)\11.txt
文件 5106 2018-10-28 13:36 聚类有效性指标(4内4外)\2016grade_z.txt
文件 2831 2006-09-19 17:13 聚类有效性指标(4内4外)\daisy.m
文件 8704 2006-05-09 10:18 聚类有效性指标(4内4外)\daisyc.dll
文件 227 2007-04-05 09:11 聚类有效性指标(4内4外)\ind2cluster.m
文件 20832 2006-12-11 16:40 聚类有效性指标(4内4外)\leuk72_3k.txt
文件 1337 2009-07-08 23:42 聚类有效性指标(4内4外)\license.txt
文件 3883 2018-10-28 20:44 聚类有效性指标(4内4外)\mainClusterValidationNC.m
文件 723 2009-07-07 17:42 聚类有效性指标(4内4外)\Notice_contributedFiles.txt
文件 8288 2006-10-24 23:01 聚类有效性指标(4内4外)\pam.m
文件 12800 2006-05-09 10:22 聚类有效性指标(4内4外)\pamc.dll
文件 3863 2009-07-01 11:03 聚类有效性指标(4内4外)\ReadmeChinese.txt
文件 5259 2009-07-01 11:03 聚类有效性指标(4内4外)\ReadmeEnglish.txt
文件 514 2006-12-18 15:46 聚类有效性指标(4内4外)\similarity_euclid.m
文件 479 2007-03-11 10:35 聚类有效性指标(4内4外)\similarity_pearson.m
文件 556 2007-03-10 22:25 聚类有效性指标(4内4外)\similarity_pearsonC.m
文件 304 2006-12-18 15:52 聚类有效性指标(4内4外)\standarz.m
文件 1936 2007-06-14 20:53 聚类有效性指标(4内4外)\validity_Index.m
文件 961 2007-02-10 14:49 聚类有效性指标(4内4外)\valid_clusterIndex.m
文件 780 2007-04-05 09:32 聚类有效性指标(4内4外)\valid_errorate.m
文件 621 2007-03-10 23:02 聚类有效性指标(4内4外)\valid_findk.m
文件 823 2007-03-15 08:59 聚类有效性指标(4内4外)\valid_index_plot.m
文件 881 2007-03-15 09:10 聚类有效性指标(4内4外)\valid_internal_deviation.m
文件 1201 2007-03-15 10:05 聚类有效性指标(4内4外)\valid_internal_intra.m
文件 1258 2007-03-10 22:28 聚类有效性指标(4内4外)\valid_intrainter.m
文件 1718 2006-10-24 20:49 聚类有效性指标(4内4外)\valid_RandIndex.m
文件 889 2007-03-10 21:49 聚类有效性指标(4内4外)\valid_sumpearson.m
文件 1375 2007-03-10 21:47 聚类有效性指标(4内4外)\valid_sumsqures.m
文件 1429 2004-07-31 17:28 聚类有效性指标(4内4外)\xlim2.m
文件 1405 2018-10-28 13:39 聚类有效性指标(4内4外)\yourdata.txt
............此处省略4个文件信息
相关资源
- 机器学习与R语言machine_learning
- SVM分类器代码
- 异常检测高斯分布模型+测试数据
- coursera吴恩达机器学习讲义pdf
- coursera吴恩达机器学习全套教学视频
- 红酒、白酒质量数据集,可作为机器
- LogiReg_data.txt 逻辑回归 成绩与录取
- 鸢尾花(iris)数据集209307
- 机器学习文献综述
- 机器学习西瓜数据集4.0
- 鸢尾花数据集xlsx格式
- BP神经网络详解
- 研究生院凸优化授课视频(重发)
- 《集体智慧编程》(Programming Collect
- KNN识别LED数码管
- machine learning SVM classify algorithm
- 宽度学习ppt
- 国科大模式识别与机器学习考题总结
- 机器学习 数据集
- Forest Fires Data Set
- 机器学习西瓜分类贝叶斯算法详解
- SVM_Iris.rar
- R语言LDA对鸾尾花数据分类
- 机器学习系列分享.txt
- 鸢尾花iris数据集,用于机器学习训练
- 适用于libsvm的iris数据集
- 吴恩达机器学习资料包
- 吴恩达-李飞飞-林轩田等机器学习深度
- 金融风控建模教程-申请评分卡的数据
- 斯坦福大学公开课 《机器学习课程》
评论
共有 条评论