• 大小: 1.28MB
    文件类型: .pdf
    金币: 2
    下载: 0 次
    发布日期: 2024-02-01
  • 语言: 其他
  • 标签: 刘克  马尔可夫  

资源简介

(不是扫描版,很清晰的pdf)马尔可夫决策过程是研究随机环境下多阶段决策过程优化问题的理论工具.在过去的几十年 中, 随着生态科学、经济理论、通讯工程以及众多学科中需要考虑不确定因素和序列决策问题 的大量新模型的涌现, 进一步刺激了马尔可夫决策过程在理论上和应用领域中长足的发展. 本书从简单的例子开始, 介绍了马尔可夫决策过程的基本概念、决策过程以及一些常用 的基本理论.还介绍了多种最优准则, 包括有限阶段准则、折扣准则、平均准则、权重报酬准 则、概率准则等.从模型角度考虑了有限状态空间、可数状态空间和一般Borel 状态空间; 从 决策时间上来说, 考虑了离散时间、连续时间和半马氏决策时刻问题.本文还介绍了大量的应 用实例以及建模方法.本书可作为高年级大学生和研究生教材, 也可作为运筹学、管理科学、 信息科学、系统科学以及计算机科学和工程领域的学者和技术人员的参考书.

资源截图

代码片段和文件信息

评论

共有 条评论