资源简介
用模糊强化学习,需预先设定模糊规则,本代码描述了Cartpole学习的强化学习过程,有兴趣可以学习一下
代码片段和文件信息
import FuzzySet
import StateVariable
import FQL
import FIS
from Environment import Environment
import matplotlib.pyplot as plt
# Create FIS
x1 = StateVariable.InputStateVariable(FuzzySet.Trapeziums(-2.4 -2 -1 -0.5) FuzzySet.Trapeziums(-1 -0.5 0.5 1) FuzzySet.Trapeziums(0.5 1 2 2.4) )
x2 = StateVariable.InputStateVariable(FuzzySet.Triangles(-2.4-0.51) FuzzySet.Triangles(-0.512.4))
x3 = StateVariable.InputStateVariable(FuzzySet.Triangles(-3.14159 -1.5 0) FuzzySet.Triangles(-1.5 0 1.5) FuzzySet.Triangles(0 1.5 3.1459))
x4 = StateVariable.InputStateVariable(FuzzySet.Triangles(-3.14159 -1.5 0) FuzzySet.Triangles(-1.5 0 1.5) FuzzySet.Triangles(0 1.5 3.1459))
fis = FIS.Build(x1x2x3x4)
# Create Model
angel_list = []
model = FQL.Model(gamma = 0.9 alpha = 0.1 ee_rate = 0.999 q_initial_value = ‘random‘
action_set_length = 21 fis = fis)
env = Environment()
for iteration in range (05000):
if iteration % 100 == 0 or reward == -1:
env.__init__()
action = model.get_initial_action(env.state)
reward state_value = env.apply_action(action)
action = model.run(state_value reward)
reward state_value = env.apply_action(action)
if reward != -1:
angel_list.append(state_value[2])
plt.figure(figsize=(143))
plt.plot(angel_list)
plt.ylabel(‘Pole Angel‘)
plt.show()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 1408 2018-01-25 19:07 模糊强化学习\Cartpole.py
文件 3116 2018-01-25 19:08 模糊强化学习\Environment.py
文件 2912 2018-01-25 19:38 模糊强化学习\Environment.pyc
文件 572 2018-01-25 19:03 模糊强化学习\FIS.py
文件 1012 2018-01-25 19:38 模糊强化学习\FIS.pyc
文件 3840 2018-01-25 18:39 模糊强化学习\FQL.py
文件 4343 2018-01-25 19:38 模糊强化学习\FQL.pyc
文件 1495 2018-01-25 19:11 模糊强化学习\FuzzySet.py
文件 1583 2018-01-25 19:38 模糊强化学习\FuzzySet.pyc
文件 201 2018-01-25 19:12 模糊强化学习\StateVariable.py
文件 642 2018-01-25 19:38 模糊强化学习\StateVariable.pyc
目录 0 2018-01-25 19:38 模糊强化学习
----------- --------- ---------- ----- ----
21124 12
- 上一篇:基于Qt绘制的时间轴demo
- 下一篇:汇编实现pwm及按键控制
相关资源
- 模糊PID控制算法
- 模糊PD和模糊PI控制器
- seed数据集
- 基于模糊PID的智能小车控制算法研究
- 模糊PID C 程序源码
- 模糊自适应PID控制器设计
- 模糊控制技术在全自动洗衣机的应用
- 基于模糊神经网络的自适应PID控制器
- ztree模糊搜索demo
- 无刷直流电机-基于模糊自适应PID控制
- Fuzzycontrol使用经验手册.pdf
- 基于模糊c聚类的图像分割
- zTree模糊查询Demo
- 直流电机模糊控制实验
- 仿网易新闻评论+模糊半透明图层
- 模糊聚类算法
- 基于模糊自适应PID的智能车辆路径跟
- 基于LQR的二级倒立摆模糊控制
- 一级倒立摆模糊控制
- 一种新的模糊支持向量机算法的推演
- 船舶航行的模糊模型建模及航向控制
- 模糊自适应PID
- 双容水箱实验报告(采用PID+模糊控制
- t-s模糊神经网络程序
- zw_fuzzy_pid.zip
- 基于智能模糊PID控制和PLC控制的恒压
- 自主水下航行器模糊自校正航迹控制
- SIRM模糊算法控制一级直线倒立摆
- 基于双隶属度模糊支持向量机的邮件
- 模糊控制算法C程序源码
评论
共有 条评论