资源简介

强化深度学习迷宫问题

资源截图

代码片段和文件信息

import tensorflow as tf
import numpy as np
from collections import deque
import random


class DeepQNetwork:
    r = np.array([[-1 -1 -1 -1 0 -1]
                  [-1 -1 -1 0 -1 100.0]
                  [-1 -1 -1 0 -1 -1]
                  [-1 0 0 -1 0 -1]
                  [0 -1 -1 1 -1 100]
                  [-1 0 -1 -1 0 100]
                  ])

    # 执行步数。
    step_index = 0

    # 状态数。
    state_num = 6

    # 动作数。
    action_num = 6

    # 训练之前观察多少步。
    OBSERVE = 1000.

    # 选取的小批量训练样本数。
    BATCH = 20

    # epsilon 的最小值,当 epsilon 小于该值时,将不在随机选择行为。
    FINAL_EPSILON = 0.0001

    # epsilon 的初始值,epsilon 逐渐减小。
    INITIAL_EPSILON = 0.1

    # epsilon 衰减的总步数。
    EXPLORE = 3000000.

    # 探索模式计数。
    epsilon = 0

    # 训练步数统计。
    learn_step_counter = 0

    # 学习率。
    learning_rate = 0.001

    # γ经验折损率。
    gamma = 0.9

    # 记忆上限。
    memory_size = 5000

    # 当前记忆数。
    memory_counter

 属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件      429107  2020-07-09 18:10  鍒嗗竷寮忚绠楁湡鏈綔涓?pptx
     文件         277  2020-07-09 18:10  __MACOSX\._鍒嗗竷寮忚绠楁湡鏈綔涓?pptx
     文件       11257  2020-07-15 13:08  杩峰.py
     文件         384  2020-07-15 13:08  __MACOSX\._杩峰.py

评论

共有 条评论