资源简介
sutton强化学习书籍的所有matlab例子,学习很有用,不易找到
代码片段和文件信息
%function [] = binary_bandit_exps(nBnPp_win)
%
% Duplicates the binary bandit experiments.
%
% Inputs:
% nB: the number of bandits
% nP: the number of plays (times we will pull a arm)
% p_win: p_win(i) is the probability we win when we pull arm i.
%
% Written by:
% --
% John L. Weatherwax 2007-11-13
%
% email: wax@alum.mit.edu
%
% Please send comments and especially bug reports to the
% above email address.
%
%-----
%close all;
%clc;
%clear;
% if( nargin<1 ) % the number of bandits:
% nB = 2000;
% end
% if( nargin<2 ) % the number of plays (times we will pull a arm):
% nP = 2000;
% end
% if( nargin<3 )
% p_win = [ 0.1 0.2 ];
% p_win = [ 0.8 0.9 ];
% end
% the number of arms:
nA = 2;
[dumbestArm] = max( p_win );
%randn(‘seed
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 41472 2010-09-28 20:38 suntton强化学习书籍所有代码\suntton非matlab代码说明.doc
..A..H. 162 2010-09-28 17:08 suntton强化学习书籍所有代码\~$内容说明.doc
文件 121344 2010-09-28 20:42 suntton强化学习书籍所有代码\内容说明.doc
文件 2091 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\blocking_mz_sc
文件 2636 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\do_ex_9_1_exps.m.m
文件 7859 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\dynaQplus_maze.m.m
文件 2487 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\dynaQplus_maze_sc
文件 7419 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\dynaQ_maze.m.m
文件 2066 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\dynaQ_maze_sc
文件 8114 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\ex_9_4_dynaQplus.m.m
文件 4322 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\ex_9_4_dynaQplus_sc
文件 516 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\mk_ex_9_1_mz.m.m
文件 565 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\mk_ex_9_2_mz.m.m
文件 563 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\mk_ex_9_3_mz.m.m
文件 1809 2008-03-27 08:32 suntton强化学习书籍所有代码\Chapter 9 (Planning and Learning)\plot_mz_policy.m.m
文件 1848 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\do_mnt_car_Exps.m
文件 2774 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\GetTiles_Mex.C
文件 809 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\GetTiles_Mex_sc
文件 939 2010-09-28 17:23 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\get_ctg.m
文件 684 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\linAppFn.m
文件 5579 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\mnt_car_learn.m
文件 909 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\next_state.m
文件 1034 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\ret_q_in_st.m
文件 2087 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\stp_fn_approx_sc
文件 348 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\targetF.m
文件 4184 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\tiles.C
文件 340 2010-09-28 17:22 suntton强化学习书籍所有代码\Chapter 8 (Generailzation and Function Approximation)\tiles.h
文件 1285 2010-09-28 17:21 suntton强化学习书籍所有代码\Chapter 7 (Eligibility Traces)\eg_7_5_episode.m
文件 1783 2010-09-28 17:21 suntton强化学习书籍所有代码\Chapter 7 (Eligibility Traces)\eg_7_5_learn_at.m
文件 1777 2010-09-28 17:21 suntton强化学习书籍所有代码\Chapter 7 (Eligibility Traces)\eg_7_5_learn_rt.m
............此处省略95个文件信息
相关资源
- Moravec_corrlation moravec算子提取特征点
- Morlet_Matlab
- contourlet_toolbox 基于非下采样contourle
- contourlet 基于contourlet的图像融合利用
- RL(Richardson-Lucy) 采用基于RL(Richa
- Shearletimagefusion shearlet图像融合的源代
- Contourlet contourlet图像融合的matlab源代
- DFIG_grid_contorl DFIG网侧控制
- Wavelet_IRLS 压缩感知CS——采用小波变
- CRLB 一个关于克拉美罗界的代码
- D2D-underlay-power-control-
- nsct 提出基于非采样contourlet变换的红
- nsct_toolbox 多尺度图像非下采样轮廓波
- MonteCarlo
- swerling 自己写的关于雷达目标RCS起伏
- 20064817924orl_faces_112x92 ORL人脸图像库
- Particle-Filter-with-comments 有注释的粒子
- nsct_toolbox nsct 非下采样的contourlet变换
- fuse-by-contourlet 多种融合规则
- Monte-Carlo
- shearlet 此程序为shearlet程序
- DRLSE_v0 Full domain implementation
- morlet小波分析matlab程序
- lms-nlms-rls-matlab
- MonteCarlo 蒙特卡罗方法 Matlab源代码
- marlab绘制混凝土梁弯矩-曲率曲线
- 最小二乘滤波RLS
- erlangB计算器
- 信道自适应均衡算法:RLS算法
- 磁耦合谐振式充电系统RLC谐振仿真
评论
共有 条评论