• 大小: 46KB
    文件类型: .rar
    金币: 1
    下载: 0 次
    发布日期: 2021-06-09
  • 语言: 其他
  • 标签: 机器学习  

资源简介

常用内部(Sil,CH,DBI,KL)、外部评价指标(Rand等4个),用自带样本集“leuk72_3k.txt”测试可用!

资源截图

代码片段和文件信息

function result = daisy(xvtypemetric)

%DAISY returns a matrix containing all the pairwise dissimilarities
%(distances) between observations in the dataset.  The original
%variables may be of mixed types.
%
%The calculation of dissimilarities is explained in:
%   Kaufman L. and Rousseeuw P.J. (1990)
%   “Finding groups in data: An introduction to cluster analysis“
%   Wiley-Interscience: New York (Series in Applied Probability and
%   Statistics) ISBN 0-471-87876-6.
%
% Required input arguments:
%   x : Data matrix (rows = observations columns = variables)
%   vtype : Variable type vector (length equals number of variables)
%       Possible values are 1  Asymmetric binary variable (0/1)
%                           2  Nominal variable (includes symmetric binary)
%                           3  Ordinal variable
%                           4  Interval variable
%
% Optional input arguments:
%   metric : Metric to be used (default euclidian (eucli) or mixed (mixed))
%       Possible values are ‘eucli‘ Euclidian (all interval variables)
%                           ‘manha‘ Manhattan
%                           ‘mixed‘ Mixed (not all interval variables)
%
% I/O:
%   result=daisy(xvtype‘eucli‘)
%
% Example (subtracted from the referenced book)
%   load flower.mat
%   result=daisy(flower[2 2 1 2 3 3 4]);
%
% The output of DAISY is a structure containing:
%   result.disv       : dissimilarities (read row by row from the
%                       lower dissimilarity matrix)
%   result.metric     : used metric
%   result.number     : number of observations
%
% This function is part of LIBRA: the Matlab Library for Robust Analysis
% available at:
%              http://wis.kuleuven.be/stat/robust.html
%
% Written by Guy Brys and Wai Yan Kong (May 2006)

%Checking and filling in the inputs
if (nargin<2)
    error(‘Two input arguments required‘)
elseif (nargin<3)
    if (sum(vtype)~=4*size(x2))
        metric = ‘mixed‘;
        metr = 0;
    else
        metric = ‘eucli‘;
        metr = 1;
    end
elseif (nargin==3)
    if strcmp(metric‘eucli‘)
        metr=1;
    elseif strcmp(metric‘manha‘)
        metr=2;
    elseif strcmp(metric‘mixed‘)
        metr=0;
    end
end

%Standardizing in case of mixed metric
if (sum(vtype)~=4*size(x2))
    colmin = min(x);
    colextr = max(x)-colmin;
    x = (x - repmat(colminsize(x1)1))./repmat(colextrsize(x1)1);
end

%Replacement of missing values
jtmd = repmat(11size(x2))-2*(sum(isnan(x))>0);
valmisdat = min(min(x))-0.5;
x(isnan(x)) = valmisdat;
valmd = repmat(valmisdat1size(x2));

%Actual calculations
disv=daisyc(size(x1)size(x2)xvalmdjtmdvtypemetr);

%Putting things together
result = struct(‘disv‘disv‘metric‘metric‘number‘size(x1));



 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件      20688  2018-10-28 19:36  聚类有效性指标(4内4外)\11.txt

     文件       5106  2018-10-28 13:36  聚类有效性指标(4内4外)\2016grade_z.txt

     文件       2831  2006-09-19 17:13  聚类有效性指标(4内4外)\daisy.m

     文件       8704  2006-05-09 10:18  聚类有效性指标(4内4外)\daisyc.dll

     文件        227  2007-04-05 09:11  聚类有效性指标(4内4外)\ind2cluster.m

     文件      20832  2006-12-11 16:40  聚类有效性指标(4内4外)\leuk72_3k.txt

     文件       1337  2009-07-08 23:42  聚类有效性指标(4内4外)\license.txt

     文件       3883  2018-10-28 20:44  聚类有效性指标(4内4外)\mainClusterValidationNC.m

     文件        723  2009-07-07 17:42  聚类有效性指标(4内4外)\Notice_contributedFiles.txt

     文件       8288  2006-10-24 23:01  聚类有效性指标(4内4外)\pam.m

     文件      12800  2006-05-09 10:22  聚类有效性指标(4内4外)\pamc.dll

     文件       3863  2009-07-01 11:03  聚类有效性指标(4内4外)\ReadmeChinese.txt

     文件       5259  2009-07-01 11:03  聚类有效性指标(4内4外)\ReadmeEnglish.txt

     文件        514  2006-12-18 15:46  聚类有效性指标(4内4外)\similarity_euclid.m

     文件        479  2007-03-11 10:35  聚类有效性指标(4内4外)\similarity_pearson.m

     文件        556  2007-03-10 22:25  聚类有效性指标(4内4外)\similarity_pearsonC.m

     文件        304  2006-12-18 15:52  聚类有效性指标(4内4外)\standarz.m

     文件       1936  2007-06-14 20:53  聚类有效性指标(4内4外)\validity_Index.m

     文件        961  2007-02-10 14:49  聚类有效性指标(4内4外)\valid_clusterIndex.m

     文件        780  2007-04-05 09:32  聚类有效性指标(4内4外)\valid_errorate.m

     文件        621  2007-03-10 23:02  聚类有效性指标(4内4外)\valid_findk.m

     文件        823  2007-03-15 08:59  聚类有效性指标(4内4外)\valid_index_plot.m

     文件        881  2007-03-15 09:10  聚类有效性指标(4内4外)\valid_internal_deviation.m

     文件       1201  2007-03-15 10:05  聚类有效性指标(4内4外)\valid_internal_intra.m

     文件       1258  2007-03-10 22:28  聚类有效性指标(4内4外)\valid_intrainter.m

     文件       1718  2006-10-24 20:49  聚类有效性指标(4内4外)\valid_RandIndex.m

     文件        889  2007-03-10 21:49  聚类有效性指标(4内4外)\valid_sumpearson.m

     文件       1375  2007-03-10 21:47  聚类有效性指标(4内4外)\valid_sumsqures.m

     文件       1429  2004-07-31 17:28  聚类有效性指标(4内4外)\xlim2.m

     文件       1405  2018-10-28 13:39  聚类有效性指标(4内4外)\yourdata.txt

............此处省略4个文件信息

评论

共有 条评论