资源简介
机器学习、人工智能、数据挖掘中经常用到的数据集,聚类分析也经常用,包括:UCI的数据集wine,yeast,iris等,还有USPS数据集,4k2_far,leuk72_3k数据集等。
代码片段和文件信息
clear all;
clc;
load(‘USPStrainingdata.mat‘);%读入训练样本数据库
[charNumbersdimension]=size(traindata);%获得样本数据库中样本中个数charNumbers和每个字符向量维数dimension
image=zeros(1616);%初始化归一化图像
P=mat2gray(traindata);%转换为灰度图像
fid = fopen(‘usps.bin‘‘wb‘);
startx=0;
overx=0;
len=0;
for k=1:50
class=find(traintarg(k:)==1)-1;%获取当前字符的类别
for i=1:16
for j=1:16
image(ij)=P(k(i-1)*16+j);
end
end
th= graythresh(image);%求灰度图像的阈值th
I=im2bw(imageth);%二值化字符图像
I=~I;
% g=bwmorph(I‘thin‘1);%细化二值化图形
% subplot(510k)imshow(~I);%显示字符图像
fwrite(fidclass‘uchar‘); %记录字符图像的类别
fwrite(fid255‘uchar‘); %记录字符图像的类别
fwrite(fid255‘uchar‘); %记录字符图像的类别
for i=1:16
for j=1:16
pixel=I(ij);
if (~startx & ~overx & pixel==0)
beginx = j-1;
beginy = i-1;
startx = 1;
end
%遇到第一个白色像素
if (~overx & startx && pixel==1)
endx = j-1;
overx = 1;
end
%已经到了行尾
if (~overx & startx & pixel==0 && j==16)
endx = j-1;
overx = 1;
end
if (startx==1 && overx==1)
length = endx - beginx;
startx = 0;
overx = 0;
fwrite(fidbeginx‘uchar‘); %写入图象的宽度和高度
fwrite(fidbeginy‘uchar‘); %写入图象的宽度和高度
fwrite(fidlength‘uchar‘); %写入图象的宽度和高度
length=0;
found=1;
end
end
end
%写入结束标志
if (found==1)
fwrite(fid0‘uchar‘); %写入图象的宽度和高度
fwrite(fid0‘uchar‘); %写入图象的宽度和高度
fwrite(fid0‘uchar‘); %写入图象的宽度和高度
end
end
fclose(fid);
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 4698 2014-03-19 19:49 Iris.txt
文件 20832 2006-12-11 16:40 leuk72_3k.txt
文件 1203 2014-03-19 19:47 Wine Desc
文件 10958 2014-03-19 19:47 wine.txt
文件 96458 2014-03-19 20:36 yeast.txt
文件 2216 2004-05-23 17:29 UCI_arff\accuracy.txt
文件 143336 1999-04-07 14:33 UCI_arff\arff\anneal.arff
文件 129637 2004-05-23 12:20 UCI_arff\arff\artificial.arff
文件 45903 1999-04-07 14:33 UCI_arff\arff\audiology.arff
文件 13356 2004-05-22 17:16 UCI_arff\arff\auto-mpg.arff
文件 30676 1999-03-11 08:31 UCI_arff\arff\autos.arff
文件 8714 1999-04-07 14:34 UCI_arff\arff\balance-scale.arff
文件 3412 2004-05-22 17:42 UCI_arff\arff\balloons.arff
文件 29418 1999-04-07 14:34 UCI_arff\arff\breast-cancer.arff
文件 19167 1999-03-11 08:31 UCI_arff\arff\breast-w.arff
文件 11330 2004-05-23 14:52 UCI_arff\arff\bridges2.arff
文件 322654 2004-05-22 23:06 UCI_arff\arff\clean1.arff
文件 63983 1999-04-07 14:35 UCI_arff\arff\colic.arff
文件 5971512 2004-05-23 14:29 UCI_arff\arff\connect-4.arff
文件 34315 1999-03-11 08:31 UCI_arff\arff\credit-a.arff
文件 162249 1999-03-11 08:31 UCI_arff\arff\credit-g.arff
文件 37419 1999-03-11 08:31 UCI_arff\arff\diabetes.arff
文件 9964 2004-05-23 12:39 UCI_arff\arff\echocardiogram.arff
文件 17325 2004-05-23 14:32 UCI_arff\arff\flag.arff
文件 17823 1999-03-11 08:31 UCI_arff\arff\glass.arff
文件 8231 2004-05-22 18:36 UCI_arff\arff\hayes-roth.arff
文件 35596 1999-04-07 14:37 UCI_arff\arff\heart-c.arff
文件 31259 1999-04-07 14:38 UCI_arff\arff\heart-h.arff
文件 13151 1999-03-11 08:31 UCI_arff\arff\heart-statlog.arff
文件 17135 1999-03-11 08:31 UCI_arff\arff\hepatitis.arff
............此处省略38个文件信息
相关资源
- 乳腺肿瘤诊断数据集
- VRP的py禁忌搜索+tsplib数据集与matlab.
- matlab实现的MINIST数据集的分类识别
- elmtrain 将整个数据集中的103个样本随
- 多种矩阵形式的数据集
- CFSFDP 密度峰值聚类算法源码
- popular-UCI-datasets 一些非常有用的数据
- MNIST-handwritten-digits 手写数字识别数据
- heart_scale 该文件为libsvm核心数据集文
- train-images-idx3-ubyte MNIST数据集中图像数
- UCI 利用k-means对UCI数据集进行聚类分析
- K-means聚类分析Iris数据集模式识别
- fisher算法留一法验证iris数据集matlab实
- 迁移学习数据集百度云盘地址
- UCI部分数据集matlab版本
- ID3决策树算法-iris数据集-matlab实现-决
- pie数据集matlab版本
- MATLAB数据集 wine 分类识别.xls
- C4.5算法的matlab实现连续值属性及西瓜
- heart_scale的matlab数据集
评论
共有 条评论