源码之巅峰
全部资源
全部资源
C/C++
C#
PHP
Java
Python
VB
ASP
Html/CSS
Matlab
JavaScript
数据库
模板
其他
上传
VIP购买
登录
注册账号
C#
C/C++
PHP
Java
Python
VB
ASP
Html/CSS
Matlab
JavaScript
数据库
模板
AI
其他
当前位置:> TAG标签 >
策略迭代
论文研究 - 连续时间马尔可夫决策过
0
编程语言:
其他
大小:
金币:
上传人:ligangyuer
发布日期:2024-01-10
本文考虑了连续时间马尔可夫决策过程中平均报酬的方差优化问题。 假设状态空间是可计数的,而动作空间是Borel可测量的空间。 本文的主要目的是在确定性平稳策略空间中找到方差最
inverted-pendulum-control 利用强化学习的自
0
编程语言:
Matlab
大小:
金币:
上传人:wjd2002xx
发布日期:2021-02-02
利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态调节器最优控制方法,实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强,进行了高斯白噪
2条
热门下载
inverted-pendulum-control 利用强化学习的自
论文研究 - 连续时间马尔可夫决策过