资源简介
强化深度学习迷宫问题
代码片段和文件信息
import tensorflow as tf
import numpy as np
from collections import deque
import random
class DeepQNetwork:
r = np.array([[-1 -1 -1 -1 0 -1]
[-1 -1 -1 0 -1 100.0]
[-1 -1 -1 0 -1 -1]
[-1 0 0 -1 0 -1]
[0 -1 -1 1 -1 100]
[-1 0 -1 -1 0 100]
])
# 执行步数。
step_index = 0
# 状态数。
state_num = 6
# 动作数。
action_num = 6
# 训练之前观察多少步。
OBSERVE = 1000.
# 选取的小批量训练样本数。
BATCH = 20
# epsilon 的最小值,当 epsilon 小于该值时,将不在随机选择行为。
FINAL_EPSILON = 0.0001
# epsilon 的初始值,epsilon 逐渐减小。
INITIAL_EPSILON = 0.1
# epsilon 衰减的总步数。
EXPLORE = 3000000.
# 探索模式计数。
epsilon = 0
# 训练步数统计。
learn_step_counter = 0
# 学习率。
learning_rate = 0.001
# γ经验折损率。
gamma = 0.9
# 记忆上限。
memory_size = 5000
# 当前记忆数。
memory_counter
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 429107 2020-07-09 18:10 鍒嗗竷寮忚绠楁湡鏈綔涓?pptx
文件 277 2020-07-09 18:10 __MACOSX\._鍒嗗竷寮忚绠楁湡鏈綔涓?pptx
文件 11257 2020-07-15 13:08 杩峰.py
文件 384 2020-07-15 13:08 __MACOSX\._杩峰.py
- 上一篇:DCASE2016基线,GMM做SED
- 下一篇:模式识别系统——自行车需求量预测
相关资源
- python 计算猴子吃桃问题
- 基于PyTorch的深度学习技术进步
-
深度学习目标检测提取xm
l文件中的 - A*算法迷宫搜索(基于matplotlib.pyplot)
- 遗传算法解决 TSP 问题
- 深度学习入门:基于Python的理论与实
- 深度学习算法实践源码
- 《白话深度学习与TensorFlow》.pdf
- Tensorflow+实战Google深度学习框架
- mnist_CNN 深度学习小
- 解决地图填色问题
- 基于深度学习字符型图片数字验证码
- 《Python深度学习》2018英文版.pdf
- OpenCV-Python调用训练好的深度学习模型
- 深度学习之一:卷积神经网络(CNN)
- 深度学习之二:用Tensorflow实现卷积神
- 深度学习之三:深度强化学习DQN-Dee
- mnist_mlp.py
- python实现的CNN代码
- 图像数据增强
- 经典遗传算法(SGA)解非线性最优化
- CNN卷积神经网络-识别阿喵阿汪源代码
- 遗传算法、禁忌搜索、模拟退火、蚁
- keras_contrib[离线安装].zip
- voc to yolo标注文件格式转换器
- Q_Learning_maze.rar
评论
共有 条评论