资源简介
随机学习与优化在现代工程、社会、金融问题中具有广泛的应用。《随机学习与优化:基于灵敏度的方法》以一个统一的框架,涵盖了离散事件动态系统的摄动分析、马尔可大决策过程、强化学习、辨识和自适应控制等学习和优化的不同学科;并利用基于性能差分公式的简单方法介绍马尔可夫决策过程理论,通过该方法能求得以长期平均代价为准则的n阶偏差优化策略以及无折扣的Blackwell优化策略。《随机学习与优化:基于灵敏度的方法》还包含有最近发展出来的基于事件的优化方法,它为利用系统的特性来克服或减轻数灾的研究开辟了个新方向。《随机学习与优化:基于灵敏度的方法》强调以样本路径的构造为基础的物理解释,物理上的直观认识可以为完善已有的优化方法提供新思路。
为帮助读者理解掌握书中的内容,《随机学习与优化:基于灵敏度的方法》提供了大量的示例和丰富的习题。
《随机学习与优化:基于灵敏度的方法》适合作为相关专业的研究生教材,学生可从一门课程中学到原本属于多个不同学科的内容。《随机学习与优化:基于灵敏度的方法》有助于促进学习和优化领域中各学科之间的合作,对该领域的研究人员也大有裨益。
代码片段和文件信息
相关资源
- 深入浅出强化学习:原理入门 高清
- 深度强化学习 ( DQN )基本原理与A
- 强化学习 Dyna-H算法代码
- 中文翻译Mastering Chess and Shogi by Self_
- Mastering Chess and Shogi by Self_Play with a
- 强化学习面试真题
- 强化学习实验 小车爬山例程
- 基于强化学习的商品推荐系统.docx
- Deep Reinforcement Learning for List-wise Reco
- 电子科技大学强化学习作业.zip
- 论文研究-深度逆向强化学习研究综述
- 深度强化学习的交叉熵优化与策略优
- 模糊强化学习
- 强化学习精要:核心算法与TensorFlow实
- 基于强化学习的股票预测系统的研究
- 强化学习精要核心算法与TensorFlow实现
- 强化学习精要-书籍代码.rar
- DQN实现的两种版本
- 再励学习面试真题
- 一种新的多智能体强化学习算法及其
评论
共有 条评论