-
大小: 982B文件类型: .m金币: 1下载: 0 次发布日期: 2021-06-09
- 语言: Matlab
- 标签: Q-learning M
资源简介
一个简单的Q-Learning算法的综合示例,可以在Matlab仿真平台上实现。
代码片段和文件信息
state_num=6;
episode_num=300;
%初始化
gammer=0.8; %给定折扣因子
reward_R=[
-1-1-1-10-1; %设置奖励矩阵R
-1-1-10-1100;
-1-1-10-1-1;
-100-10-1;
0-1-10-1100;
-10-1-10100;
]
Q_table=zeros(size(reward_R)); %设置初始化矩阵Q
final_state=6;
%For each episode
for i=1:episode_num
current_state=randperm(state_num1); %随机选择一个状态
while current_state~=final_state
action_option=find(reward_R(
- 上一篇:基于遗传算法寻优的PID控制及MATLAB仿真
- 下一篇:四阶三次均匀B样条函数插值
相关资源
- 四阶三次均匀B样条函数插值
- 基于遗传算法寻优的PID控制及MATLAB仿
- 基于ZF准则和MMSE准则的预编码性能比
- MATLAB中V-Blast的ZF和MMSE检测算法仿真代
- 永磁电机矢量控制
- FCM目标检测代码
- 二维规划算法的MATLAB程序
- 基于MATLAB的循环频谱检测算法
- matlab 腐蚀膨胀 代码
- SVM分类程序
- 隶属函数与matlab
- LMMSE算法信道均衡MATLAB仿真
- MATLAB+2010b+破解文件
- matlab语音识别系统源代码
- 数学建模列车调度问题的MATLAB模拟程
- fang算法的仿真
- 基于matlab的图像增强设计
- OFDM的matlab程序
- BOW视觉词袋模型的matlab实现易理解,
- 加权Voronoi算法,Matlab
- 海杂波统计建模 K分布
- 超市管理系统 mdl文件
- 删除信道下的LDPC码 编译码
- 脑电信噪比计算 matlab 程序
- 无线传感网络源代码虚拟力
- matlab实现haar小波分解
- MATLAB实现ISODATA算法
- 无粘burgers方程差分求解matlab代码
- 3dmax的粒子系统 喷泉
- ldpc MATLAB
评论
共有 条评论