资源简介
MatLab强化学习代码包,使用深度Q学习(神经网络)控制倒立摆的代码。 详细说明可参看我的专栏《强化学习与控制》 https://blog.csdn.net/weixin_43723517/category_9676083.html "I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"
代码片段和文件信息
%输出控制力矩列表
FcTable=[-3-2.5-2-1.5-1-0.5-0.300.30.511.522.53];
global N_Fc
N_Fc=size(FcTable); N_Fc=N_Fc(2);
%DQN神经网络初始化
QNet_eval=fitnet([4040]);
%训练神经网络,规定输入输出
S_ini=150;
Iniset=zeros(6S_ini); %前五行为输入,最后一行为目标输出。第一行X,第二行dotX,第三行θ,第四行dotθ,第五行Fc
Iniset(1:)=0.5*rand(1S_ini)-0.5*rand(1S_ini);
Iniset(2:)=0.1*rand(1S_ini)-0.1*rand(1S_ini);
Iniset(3:)=(2*rand(1S_ini)-2*rand(1S_ini))*pi/180; %单位为弧度
Iniset(4:)=(2*rand(1S_ini)-2*rand(1S_ini))*pi/180; %单位为弧度
Iniset(5:)=unidrnd(N_Fc1S_ini);
for i=1:S_ini
Iniset(6i)=Reward_Cal(Iniset(1:4i));
end
QNet_eval=train(QNet_evalIniset(1:5:)Iniset(6:));
QNet_target=QNet_eval;
%将神经网络训练算法设置为自适应动量梯度下降法
QNet_eval.trainFcn=‘traingdx‘;
%关闭训练图窗nntraintool
%QNet_eval.trainParam.showWindow=0;
%学习参数初始化
global alpha gamma
alpha=0.55; %学习率alpha
gamma=0.99; %奖励传递效率gamma
nBatch=400; %神经网络单次训练调用的样本量
N_gap=400; %神经网络训练的频率
N_renew=3*N_gap; %目标神经网络更新的频率
%Replaymemory初始化
S_memo=4000; %MemoSize
Rmemo=zeros(9S_memo); %1-4:CPstate5act6-9:newstate
Memopointer=1; %Replay memory的写入指针
%}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 1403 2020-03-04 13:22 CartPoleDQN_DEMO\AgentInitializer.m
文件 1155 2020-03-04 10:14 CartPoleDQN_DEMO\CalculationQtarget.m
文件 280 2020-03-04 13:24 CartPoleDQN_DEMO\CartPoleInitializer.m
文件 377 2020-03-04 09:18 CartPoleDQN_DEMO\CartPoleReset.m
文件 3291 2020-03-07 16:44 CartPoleDQN_DEMO\CartPole_DQN.m
文件 619 2020-03-03 10:35 CartPoleDQN_DEMO\CartPole_Eqs.m
文件 157 2020-02-25 11:40 CartPoleDQN_DEMO\PointerMove.m
文件 204 2020-03-04 13:50 CartPoleDQN_DEMO\Reward_Cal.m
文件 422 2020-03-04 10:28 CartPoleDQN_DEMO\tcegreedy.m
目录 0 2020-03-07 14:57 CartPoleDQN_DEMO
----------- --------- ---------- ----- ----
7908 10
相关资源
- cs229的所有纸质资料
- 基于MATLAB的人脸识别系统86092
- Matlab程序小波分析时间序列数据
- matlab2014中文帮助离线版
- 可视化机器学习
- 《MATLAB GUI设计学习手记第2版》源代码
- MATLAB有限元分析工具箱
- deep learning 英文版Bengio
- Matlab 机器人工具箱RoboticsToolBox rvct
- 脑电信号特征频段预处理MATLAB代码.
- 人工神经网络算法毕业论文中的matl
- Matlab强化学习_网格迷宫问题_Sarsa算法
- Matlab强化学习_网格迷宫问题_QLearnin
- MATLAB 随机产生和为定值的n个整数
- 李宏毅 机器学习2020 完整 视频 + ppt
- 分布估计算法matlab工具箱
- matlab的findpeaks的源码,绝对正确。用
- matlab 读取显示 .obj 图形文件
- 使用Matlab调用摄像头及保存视频
- 二进制矩阵求逆MATLAB函数
- 谱减法语音增强的matlab程序
- 基于MATLAB的通信系统仿真平台设计-基
- MatLab强化学习_深度Q学习_神经网络_网
- 原创EMD和EEMD变换在信号去噪中的应用
- magnify用于matlab的放大插件.zip
-
在MatlabGUI里面启动或者暂停Simuli
n - matlab实现最小二乘法拟合椭圆方程
- MATLAB笔记合集整理.zip
- matlab GUI设置表格中单元格的背景颜色
- matlab实现基于项目的协同过滤算法
评论
共有 条评论