资源简介
DQN-Atari-Tensorflow, 在Tensorflow中,使用深度Q 学习的最简单 DQN-Atari-Tensorflow在Tensorflow中实现"深度强化学习的人级控制"这可能是DQN最简单的实现Atari游戏的实现。pretrained网络即将发布 ! PrerequsiteTensorflow (

代码片段和文件信息
import cv2
import sys
sys.path.append(“game/“)
from Atari import Atari
from BrainDQN_Nature import *
import numpy as np
# preprocess raw image to 80*80 gray image
def preprocess(observation):
observation = cv2.cvtColor(cv2.resize(observation (84 110)) cv2.COLOR_BGR2GRAY)
observation = observation[26:110:]
ret observation = cv2.threshold(observation1255cv2.THRESH_BINARY)
return np.reshape(observation(84841))
def playAtari():
# Step 1: init BrainDQN
# Step 2: init Flappy Bird Game
atari = Atari(‘breakout.bin‘)
actions = len(atari.legal_actions)
brain = BrainDQN(actions)
# Step 3: play game
# Step 3.1: obtain init state
action0 = np.array([1000]) # do nothing
observation0 reward0 terminal = atari.next(action0)
observation0 = cv2.cvtColor(cv2.resize(observation0 (84 110)) cv2.COLOR_BGR2GRAY)
observation0 = observation0[26:110:]
ret observation0 = cv2.threshold(observation01255cv2.THRESH_BINARY)
brain.setInitState(observation0)
# Step 3.2: run the game
while 1!= 0:
action = brain.getAction()
nextObservationrewardterminal = atari.next(action)
nextObservation = preprocess(nextObservation)
brain.setPerception(nextObservationactionrewardterminal)
def main():
playAtari()
if __name__ == ‘__main__‘:
main()
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2016-03-26 05:23 DQN-Atari-Tensorflow-master\
文件 1283 2016-03-26 05:23 DQN-Atari-Tensorflow-master\AtariDQN.py
文件 6756 2016-03-26 05:23 DQN-Atari-Tensorflow-master\BrainDQN_Nature.py
文件 714 2016-03-26 05:23 DQN-Atari-Tensorflow-master\README.md
目录 0 2016-03-26 05:23 DQN-Atari-Tensorflow-master\game\
文件 1317 2016-03-26 05:23 DQN-Atari-Tensorflow-master\game\Atari.py
文件 2048 2016-03-26 05:23 DQN-Atari-Tensorflow-master\game\breakout.bin
相关资源
- 开源1A锂电池充电板TP4056原理图+PCB
-
st
yles 引文样式语言( CSL ) 引文样 - 开源电调BLHeli硬件PCB 4层板 2.5cm宽
-
开源tinyxm
l - 一个比较完整的开源cad 图形程序
- 开源的nmealib
- CS1.6 透视自瞄多功能 开源.e
- SpringBoot实战(第4版)清晰版.pdf.zip
- IEC60870开源实现库
- 开源图像库leptonica头文件和库文件
- 开源自写磁盘还原
- JMeter开源性能官方书籍pdf
- 人脸识别开源SDK源码
- st官方开源的电机库foc5.0
- 原生网页封装Nativefier.zip
- 方滨兴 在线社交网络分析 方滨兴
- robomaster自动识别开源
-
优酷视频播放地址分析kupla
yer.zip - Sniffer原理及开源代码
- 国外开源视频监控iSpy源代码20180905
- 开单大师学习版3.1.2房产软件 源码 房
- 凤凰山管理系统毕设定制开源共享
- 翼型及机翼空气动力分析开源软件X
- IDCardOCR_China 基于tesseract,实现摄像头
- asn1c-0.9.24
- 极速浏览器源代码,开源中功能最强
- .net开源的维基百科系统
- 开源生态白皮书2020).pdf
- 免费开源强大的ILSpy 2.3
- 遗传算法解决TSP旅行商问题程序开源
评论
共有 条评论