资源简介
在聚类分析、机器学习、数据挖掘中常用到的数据集,包括:UCI的数据集wine,yeast,iris等,还有USPS数据集,4k2_far,leuk72_3k数据集等。
代码片段和文件信息
clear all;
clc;
load(‘USPStrainingdata.mat‘);%读入训练样本数据库
[charNumbersdimension]=size(traindata);%获得样本数据库中样本中个数charNumbers和每个字符向量维数dimension
image=zeros(1616);%初始化归一化图像
P=mat2gray(traindata);%转换为灰度图像
fid = fopen(‘usps.bin‘‘wb‘);
startx=0;
overx=0;
len=0;
for k=1:50
class=find(traintarg(k:)==1)-1;%获取当前字符的类别
for i=1:16
for j=1:16
image(ij)=P(k(i-1)*16+j);
end
end
th= graythresh(image);%求灰度图像的阈值th
I=im2bw(imageth);%二值化字符图像
I=~I;
% g=bwmorph(I‘thin‘1);%细化二值化图形
% subplot(510k)imshow(~I);%显示字符图像
fwrite(fidclass‘uchar‘); %记录字符图像的类别
fwrite(fid255‘uchar‘); %记录字符图像的类别
fwrite(fid255‘uchar‘); %记录字符图像的类别
for i=1:16
for j=1:16
pixel=I(ij);
if (~startx & ~overx & pixel==0)
beginx = j-1;
beginy = i-1;
startx = 1;
end
%遇到第一个白色像素
if (~overx & startx && pixel==1)
endx = j-1;
overx = 1;
end
%已经到了行尾
if (~overx & startx & pixel==0 && j==16)
endx = j-1;
overx = 1;
end
if (startx==1 && overx==1)
length = endx - beginx;
startx = 0;
overx = 0;
fwrite(fidbeginx‘uchar‘); %写入图象的宽度和高度
fwrite(fidbeginy‘uchar‘); %写入图象的宽度和高度
fwrite(fidlength‘uchar‘); %写入图象的宽度和高度
length=0;
found=1;
end
end
end
%写入结束标志
if (found==1)
fwrite(fid0‘uchar‘); %写入图象的宽度和高度
fwrite(fid0‘uchar‘); %写入图象的宽度和高度
fwrite(fid0‘uchar‘); %写入图象的宽度和高度
end
end
fclose(fid);
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 4698 2014-03-19 19:49 Iris.txt
文件 20832 2006-12-11 16:40 leuk72_3k.txt
文件 1203 2014-03-19 19:47 Wine Desc
文件 10958 2014-03-19 19:47 wine.txt
文件 96458 2014-03-19 20:36 yeast.txt
文件 2216 2004-05-23 17:29 UCI_arff\accuracy.txt
文件 143336 1999-04-07 14:33 UCI_arff\arff\anneal.arff
文件 129637 2004-05-23 12:20 UCI_arff\arff\artificial.arff
文件 45903 1999-04-07 14:33 UCI_arff\arff\audiology.arff
文件 13356 2004-05-22 17:16 UCI_arff\arff\auto-mpg.arff
文件 30676 1999-03-11 08:31 UCI_arff\arff\autos.arff
文件 8714 1999-04-07 14:34 UCI_arff\arff\balance-scale.arff
文件 3412 2004-05-22 17:42 UCI_arff\arff\balloons.arff
文件 29418 1999-04-07 14:34 UCI_arff\arff\breast-cancer.arff
文件 19167 1999-03-11 08:31 UCI_arff\arff\breast-w.arff
文件 11330 2004-05-23 14:52 UCI_arff\arff\bridges2.arff
文件 322654 2004-05-22 23:06 UCI_arff\arff\clean1.arff
文件 63983 1999-04-07 14:35 UCI_arff\arff\colic.arff
文件 5971512 2004-05-23 14:29 UCI_arff\arff\connect-4.arff
文件 34315 1999-03-11 08:31 UCI_arff\arff\credit-a.arff
文件 162249 1999-03-11 08:31 UCI_arff\arff\credit-g.arff
文件 37419 1999-03-11 08:31 UCI_arff\arff\diabetes.arff
文件 9964 2004-05-23 12:39 UCI_arff\arff\echocardiogram.arff
文件 17325 2004-05-23 14:32 UCI_arff\arff\flag.arff
文件 17823 1999-03-11 08:31 UCI_arff\arff\glass.arff
文件 8231 2004-05-22 18:36 UCI_arff\arff\hayes-roth.arff
文件 35596 1999-04-07 14:37 UCI_arff\arff\heart-c.arff
文件 31259 1999-04-07 14:38 UCI_arff\arff\heart-h.arff
文件 13151 1999-03-11 08:31 UCI_arff\arff\heart-statlog.arff
文件 17135 1999-03-11 08:31 UCI_arff\arff\hepatitis.arff
............此处省略38个文件信息
相关资源
- 斯坦福公开课机器学习的讲义+课后作
- 风控&反欺诈行业技术对比阶段图
- 实验报告.rar
- 特征提取之滑动窗口
- 机器学习和深度学习的技术框架对比
- 机器学习导论225937
- 精通机器学习:基于R完整目录及代码
- 运筹学第三版
- Machine Learning The Art and Science of Algori
- 机器学习包-Mlxtend 0.9.0 文档-英文
- 超详细学习报告资料模糊理论基础
- 机器学习-文档建模
- powermarker V3.25
- 数据挖掘 实用机器学习工具与技术
- PRML英文原版
- ORL人脸数据集
- 吴恩达Andrew Ng机器学习中文讲义
- 数据挖掘实用机器学习技术Data Minin
- 统计学习理论的本质+中文版
- Boosting方法-从AdaBoost到LightGBM
- 斯坦福机器学习讲义(全英文原版)
- 车牌数据集
- Andrew Ng教授关于特征表述的PPT
- Grokking Deep Learning - 最新版-无水印-有
- 基于机器学习算法的摔倒检测和日常
- 机器学习3篇综述
- 2MachineLearning机器学习-TomMitchell-中文清
- TSPLIB数据集、使用方法及最优解
- SPSS教程-聚类分析-附操作
- 低秩表示代码
评论
共有 条评论