资源简介
在聚类分析、机器学习、数据挖掘中常用到的数据集,包括:UCI的数据集wine,yeast,iris等,还有USPS数据集,4k2_far,leuk72_3k数据集等。
代码片段和文件信息
clear all;
clc;
load(‘USPStrainingdata.mat‘);%读入训练样本数据库
[charNumbersdimension]=size(traindata);%获得样本数据库中样本中个数charNumbers和每个字符向量维数dimension
image=zeros(1616);%初始化归一化图像
P=mat2gray(traindata);%转换为灰度图像
fid = fopen(‘usps.bin‘‘wb‘);
startx=0;
overx=0;
len=0;
for k=1:50
class=find(traintarg(k:)==1)-1;%获取当前字符的类别
for i=1:16
for j=1:16
image(ij)=P(k(i-1)*16+j);
end
end
th= graythresh(image);%求灰度图像的阈值th
I=im2bw(imageth);%二值化字符图像
I=~I;
% g=bwmorph(I‘thin‘1);%细化二值化图形
% subplot(510k)imshow(~I);%显示字符图像
fwrite(fidclass‘uchar‘); %记录字符图像的类别
fwrite(fid255‘uchar‘); %记录字符图像的类别
fwrite(fid255‘uchar‘); %记录字符图像的类别
for i=1:16
for j=1:16
pixel=I(ij);
if (~startx & ~overx & pixel==0)
beginx = j-1;
beginy = i-1;
startx = 1;
end
%遇到第一个白色像素
if (~overx & startx && pixel==1)
endx = j-1;
overx = 1;
end
%已经到了行尾
if (~overx & startx & pixel==0 && j==16)
endx = j-1;
overx = 1;
end
if (startx==1 && overx==1)
length = endx - beginx;
startx = 0;
overx = 0;
fwrite(fidbeginx‘uchar‘); %写入图象的宽度和高度
fwrite(fidbeginy‘uchar‘); %写入图象的宽度和高度
fwrite(fidlength‘uchar‘); %写入图象的宽度和高度
length=0;
found=1;
end
end
end
%写入结束标志
if (found==1)
fwrite(fid0‘uchar‘); %写入图象的宽度和高度
fwrite(fid0‘uchar‘); %写入图象的宽度和高度
fwrite(fid0‘uchar‘); %写入图象的宽度和高度
end
end
fclose(fid);
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 4698 2014-03-19 19:49 Iris.txt
文件 20832 2006-12-11 16:40 leuk72_3k.txt
文件 1203 2014-03-19 19:47 Wine Desc
文件 10958 2014-03-19 19:47 wine.txt
文件 96458 2014-03-19 20:36 yeast.txt
文件 2216 2004-05-23 17:29 UCI_arff\accuracy.txt
文件 143336 1999-04-07 14:33 UCI_arff\arff\anneal.arff
文件 129637 2004-05-23 12:20 UCI_arff\arff\artificial.arff
文件 45903 1999-04-07 14:33 UCI_arff\arff\audiology.arff
文件 13356 2004-05-22 17:16 UCI_arff\arff\auto-mpg.arff
文件 30676 1999-03-11 08:31 UCI_arff\arff\autos.arff
文件 8714 1999-04-07 14:34 UCI_arff\arff\balance-scale.arff
文件 3412 2004-05-22 17:42 UCI_arff\arff\balloons.arff
文件 29418 1999-04-07 14:34 UCI_arff\arff\breast-cancer.arff
文件 19167 1999-03-11 08:31 UCI_arff\arff\breast-w.arff
文件 11330 2004-05-23 14:52 UCI_arff\arff\bridges2.arff
文件 322654 2004-05-22 23:06 UCI_arff\arff\clean1.arff
文件 63983 1999-04-07 14:35 UCI_arff\arff\colic.arff
文件 5971512 2004-05-23 14:29 UCI_arff\arff\connect-4.arff
文件 34315 1999-03-11 08:31 UCI_arff\arff\credit-a.arff
文件 162249 1999-03-11 08:31 UCI_arff\arff\credit-g.arff
文件 37419 1999-03-11 08:31 UCI_arff\arff\diabetes.arff
文件 9964 2004-05-23 12:39 UCI_arff\arff\echocardiogram.arff
文件 17325 2004-05-23 14:32 UCI_arff\arff\flag.arff
文件 17823 1999-03-11 08:31 UCI_arff\arff\glass.arff
文件 8231 2004-05-22 18:36 UCI_arff\arff\hayes-roth.arff
文件 35596 1999-04-07 14:37 UCI_arff\arff\heart-c.arff
文件 31259 1999-04-07 14:38 UCI_arff\arff\heart-h.arff
文件 13151 1999-03-11 08:31 UCI_arff\arff\heart-statlog.arff
文件 17135 1999-03-11 08:31 UCI_arff\arff\hepatitis.arff
............此处省略38个文件信息
相关资源
- Iris数据集分类,查看几种分类方法的
- 陈强stata数据集
- ppt 机器学习.ppt
- 基于pytorch的UNet_demo实现及训练自己的
- 多目标跟踪MOT16_Benchmark数据集链接
- Logistic回归总结非常好的机器学习总结
- LCSTS高质量中文短文本摘要数据集
- Convex Analysis and Optimization (Bertsekas
- 机器学习个人笔记完整版v5.2-A4打印版
- JUNIOR:粒子物理学中无监督机器学习
- EMC中国人寿再保险公司数据集中存储
- 语料库.zip
- 银行搜索数据集(bankresearch dataset)
- 中国科学技术大学 研究生课程 机器学
- 遗传算法越野小车unity5.5
- 吴恩达机器学习编程题
- shape_predictor_68_face_landmarks.dat.bz2 68个标
- 机器学习实战高清pdf,中文版+英文版
- 李宏毅-机器学习(视频2017完整)
- 机器学习深度学习 PPT
- 麻省理工:深度学习介绍PPT-1
- 常用数据挖掘数据集
- Wikipedia机器学习迷你电子书之四《D
- Google论文\“Wide & Deep Learning for Recom
- Learning From Data Yaser S. Abu-Mostafa
- 深度学习数据集标注
- WEKA arff 实验数据集---数据挖掘用
- 基于决策树和朴素贝叶斯算法对Adul
- kinetics600.tar.gz
- 北大林宙辰:机器学习一阶算法的优
评论
共有 条评论