资源简介
Q强化学习matlab源代码,注释详细,本人亲自运行测试。
代码片段和文件信息
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% Q learning of single agent move in N rooms
% Matlab Code companion of
% Q Learning by Example
%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
function q=ReinforcementLearning
clc;
format short
format compact
% Two input: R and gamma
% immediate reward matrix;
% row and column = states; -Inf = no door between room
R=[-inf-inf-inf-inf 0 -inf;
-inf-inf-inf 0-inf 100;
-inf-inf-inf 0-inf -inf;
-inf 0 0-inf 0 -inf;
0-inf-inf 0-inf 100;
-inf 0-inf-inf 0 100];
gamma=0.80; % learning parameter
q=zeros(size(R)); % initialize Q as zeroq的行数和列数等于矩阵R的。
q1=ones(size(R))*inf; % initialize previo
- 上一篇:matlab实现线性卷积和循环卷积
- 下一篇:PCA matlab代码
相关资源
- HMMforspeechrecogntion 一个可执行的HMM语音
- popular-UCI-datasets 一些非常有用的数据
- GAPSO 这个算法是遗传算法和粒子群优
- synchronization 利用matlab仿真实现载波的
- Gabor Gabor小波变换的matlab实现
- 4 matlab区域填充的具体算法及演示
- MATLAB_image_process_with_PDE 运用偏微分方
- gabijiao 该程序通过实例(函数)
- SIFT2844912
- gbvs 二维图像视觉显著性检测
- wenli 分析了纹理特征提取方法
- EELM
- barcode 基于图像的条形码识别程序(识
-
myaudiopla
yer 使用Matlab GUI实现的音频 - B-spline-surface 在MATLAB-2008a环境下编写的
- NURBS-surface 在MATLAB-2008a环境下编写的
- ACO 用MATLAB编写的蚁群算法最短路径寻
- wavplay 基于matlab GUI界面的播放器
- allfns 是由牛津大学VGG开发的三维重建
- spectrogram_fft
- adaboost 基于adaboost的人脸识别程序
- 2 2课程报告要求:按照讲课内容
- gps GPS信号的捕获、处理程序
- fuzzynetme 模糊神经网络的MATLAB程序
- naive_bayes_numeric 利用matlab实现的朴素贝
- MFandMPF 计算肌电信号积分肌电值
- BM3D BM3D去噪算法的实现和相关文档
- BarrelDistortion 两个matlab程序
- Kalman 用卡尔曼滤波跟踪目标实例
- WSN-matlab-simulation
评论
共有 条评论