资源简介
用模糊强化学习,需预先设定模糊规则,本代码描述了Cartpole学习的强化学习过程,有兴趣可以学习一下

代码片段和文件信息
import FuzzySet
import StateVariable
import FQL
import FIS
from Environment import Environment
import matplotlib.pyplot as plt
# Create FIS
x1 = StateVariable.InputStateVariable(FuzzySet.Trapeziums(-2.4 -2 -1 -0.5) FuzzySet.Trapeziums(-1 -0.5 0.5 1) FuzzySet.Trapeziums(0.5 1 2 2.4) )
x2 = StateVariable.InputStateVariable(FuzzySet.Triangles(-2.4-0.51) FuzzySet.Triangles(-0.512.4))
x3 = StateVariable.InputStateVariable(FuzzySet.Triangles(-3.14159 -1.5 0) FuzzySet.Triangles(-1.5 0 1.5) FuzzySet.Triangles(0 1.5 3.1459))
x4 = StateVariable.InputStateVariable(FuzzySet.Triangles(-3.14159 -1.5 0) FuzzySet.Triangles(-1.5 0 1.5) FuzzySet.Triangles(0 1.5 3.1459))
fis = FIS.Build(x1x2x3x4)
# Create Model
angel_list = []
model = FQL.Model(gamma = 0.9 alpha = 0.1 ee_rate = 0.999 q_initial_value = ‘random‘
action_set_length = 21 fis = fis)
env = Environment()
for iteration in range (05000):
if iteration % 100 == 0 or reward == -1:
env.__init__()
action = model.get_initial_action(env.state)
reward state_value = env.apply_action(action)
action = model.run(state_value reward)
reward state_value = env.apply_action(action)
if reward != -1:
angel_list.append(state_value[2])
plt.figure(figsize=(143))
plt.plot(angel_list)
plt.ylabel(‘Pole Angel‘)
plt.show()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 1408 2018-01-25 19:07 模糊强化学习\Cartpole.py
文件 3116 2018-01-25 19:08 模糊强化学习\Environment.py
文件 2912 2018-01-25 19:38 模糊强化学习\Environment.pyc
文件 572 2018-01-25 19:03 模糊强化学习\FIS.py
文件 1012 2018-01-25 19:38 模糊强化学习\FIS.pyc
文件 3840 2018-01-25 18:39 模糊强化学习\FQL.py
文件 4343 2018-01-25 19:38 模糊强化学习\FQL.pyc
文件 1495 2018-01-25 19:11 模糊强化学习\FuzzySet.py
文件 1583 2018-01-25 19:38 模糊强化学习\FuzzySet.pyc
文件 201 2018-01-25 19:12 模糊强化学习\StateVariable.py
文件 642 2018-01-25 19:38 模糊强化学习\StateVariable.pyc
目录 0 2018-01-25 19:38 模糊强化学习
----------- --------- ---------- ----- ----
21124 12
- 上一篇:基于Qt绘制的时间轴demo
- 下一篇:汇编实现pwm及按键控制
相关资源
- 梯控模糊搜索.exe
- 模糊PID控制 c
- 运动模糊的去除
- 基于模糊K均值和自适应混合蛙跳算法
- 提高风出力预测精度的储能系统模糊
- 基于模糊聚类和SVM的瓦斯涌出量预测
- 基于运动控制器MCK2407的无刷直流电机
- 基于AHP-Fuzzy-VIKOR的装配式建筑混凝土
- 基于I-Fuzzy-Smith算法的融合控制策略仿
- 基于双闭环模糊PID控制器的开关电源
- 知识型员工敬业度评价指标体系构建
- 基于隶属度转换算法的矿业投资决策
- 基于DSC的数字脉冲MIG弧焊逆变电源设
- 基于FPGA的瓦斯浓度模糊控制系统设计
- 基于模糊PI的低速表贴式永磁同步电机
- Research on Forecasting Method of Urban Water
- 突水水源的独立性权–模糊可变理
- 基于强化学习的自举式关系抽取算法
- Bamboy高斯模糊(毛玻璃)
- 信息融合、神经网络-模糊推理理论及
- 论文研究-基于fuzzyTOPSIS的资源服务优
- Google DeepMind的David Silver的强化学习课
- 《增强学习导论》Reinforcement Learning
- 智能车模糊控制
- LabVIEW实现Fuzzy_PID的补充资源
- deepstack算法详解
- 通过模糊球面几何从2D SYM构造4D N =
- 基于数据挖掘技术的液压泵的故障诊
- 掘进机行走液压系统模糊故障树分析
- 一类模糊不确定网络控制系统的H_&i
评论
共有 条评论