• 大小: 179KB
    文件类型: .caj
    金币: 1
    下载: 0 次
    发布日期: 2021-01-02
  • 语言: 其他
  • 标签: 多智体  机器人  

资源简介

在多机器人系统中,评价一个机器人行为的好坏常常依赖于其它机器人的行为,此时必须采用组合动 作以实现多机器人的协作,但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢.本文提出的新方 法通过预测各机器人执行动作的概率来降低学习空间的维数,并应用于多机器人协作任务之中.实验结果表明,基 于预测的加速强化学习算法可以比原始算法更快地获得多机器人的协作策略.

资源截图

代码片段和文件信息

评论

共有 条评论