资源简介

1. 仍然使用第一次作业中收集的数据作为训练集(注意:不得超过20+20 例样 本),采用身高和体重为特征进行性别分类,训练SVM 分类器,在测试数据 dataset1.txt 上测试分类效果。SVM 中分别使用线性核和高斯核,参数自己 确定。 2. 使用一个较大的数据集(dataset2.txt)作训练样本,采用身高和体重为特征 进行性别分类,在正态分布假设下估计概率密度,建立最小错误率贝叶斯分 类器,写出得到的决策规则;把分类器应用到dataset1.txt 上,计算测试错 误率。(自行决定采用什么先验概率。) 3. 将样本和两次作业中得到的多个分类面画到由身高和体重组成的二维平面 上,尝试进行分析和讨论。(也可以在基本要求基础上自己设计其他实验,将 结果放到一起进行分析。)

资源截图

代码片段和文件信息

%贝叶斯分类器
clear ;
%%
%获取训练样本
FID = fopen(‘dataset2.txt‘);
mydata=fscanf(FID‘%f %f %c‘[3inf]);
fclose(FID);
%男女分别数据
M_data=mydata(1:3470:954);
F_data=mydata(1:31:469);
x=mydata(1:21:954);
%%
%最大似然估计

%男生均值
M_x=M_data(1:21:485);
M_miu=(1/485)*[sum(M_x(1:));sum(M_x(2:))];
%男生协方差
M_sigma=0;
for i=1:485
M_sigma=(M_x(:i)-M_miu)*(M_x(:i)-M_miu)‘+M_sigma;
end
M_sigma=M_sigma/485;

%女生均值
F_x=F_data(1:21:469);
F_miu=(1/469)*[sum(F_x(1:));sum(F_x(2:))];
%女生协方差
F_sigma=0;
for i=1:469
F_sigma=(F_x(:i)-F_miu)*(F_x(:i)-F_miu)‘+F_sigma;
end
F_sigma=F_sigma/469;

%%
%对最小错误贝叶斯估计分界面画图
figure(3);
plot(x(1470:954)x(2470:954)‘b.‘);
hold on;
plot(x(11:469)x(21:469)‘r.‘);
hold on;

W1=-inv(M_sigma)/2;
W2=-inv(F_sigma)/2;
w1=inv(M_sigma)*M_miu;
w2=inv(F_sigma)*F_miu;

%似然比为1时
w10=-0.5*M_miu‘*inv(M_sigma)*M_miu-0.5*log(det(M_sigma))+log(0.3);
w20=-0.5*F_miu‘*inv(F_sigma)*F_miu-0.5*log(det(F_sigma))+log(0.3);

syms x y;
z=[x y]*(W1-W2)*[x;y]+transpose(w1-w2)*[x;y]+w10-w20;
likehood1=ezplot(z[14021030130]);
set(likehood1‘Color‘‘c‘‘LineWidth‘1);
hold on;

xlabel(‘Height/cm‘);
ylabel(‘Weight/kg‘);
legend(‘boy‘‘girl‘‘Minimum error ratelikehood=1‘2);
title(‘Different Hyperplane with Different Likehood‘);

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----

     文件      49800  2013-10-27 10:09  模式识别第二次作业\problemset2_1028.pdf

     文件       3300  2013-10-19 20:35  模式识别第二次作业\代码\dataset1.txt

     文件       9594  2013-11-02 23:12  模式识别第二次作业\代码\dataset2.txt

     文件       1349  2013-11-17 14:47  模式识别第二次作业\代码\Minimum_error_rate_Bayes_for_second.m

     文件       2093  2013-11-17 14:47  模式识别第二次作业\代码\Minimum_error_rate_Bayes_Hyperplane.m

     文件       1978  2013-11-17 14:47  模式识别第二次作业\代码\Minimum_risk_Bayes_Hyperplane.m

     文件       2814  2013-11-17 10:58  模式识别第二次作业\代码\myBayes.m

     文件        526  2013-10-19 18:47  模式识别第二次作业\代码\mydata.txt

     文件       3908  2013-11-17 14:47  模式识别第二次作业\代码\mySVM.m

     文件        360  2013-11-17 14:38  模式识别第二次作业\代码\my_liner_result.txt

     文件       4929  2013-11-17 14:38  模式识别第二次作业\代码\my_min_error_result.txt

     文件        353  2013-11-17 14:38  模式识别第二次作业\代码\my_RBF_result.txt

     文件       1543  2013-11-17 14:47  模式识别第二次作业\代码\SVM_Hyperplane.m

     文件       1800  2013-11-17 14:38  模式识别第二次作业\代码\teacher_liner_result.txt

     文件       1804  2013-11-17 14:38  模式识别第二次作业\代码\teacher_min_error_result.txt

     文件       1795  2013-11-17 14:38  模式识别第二次作业\代码\teacher_RBF_result.txt

     目录          0  2013-11-17 14:47  模式识别第二次作业\代码

     目录          0  2013-11-17 14:46  模式识别第二次作业

----------- ---------  ---------- -----  ----

                87946                    18


评论

共有 条评论