Reinforcement Learning - An Introduction 2nd 2017
2022-10-17 23:16:53 9.69MB RL
1
Reinforcement Learning: An Introduction Second edition, in progress November 5, 2017 Richard S. Sutton and Andrew G. Barto The text is now complete, except possibly for one more case study to be added to Chapter 16. The references still need to be thoroughly checked, and an index still needs to be added. Please send any errors to rich@richsutton.com and barto@cs.umass.edu. We are also very interested in correcting any important omissions in the \Bibliographical and Historical Remarks" at the end of each chapter. If you think of something that really should have been cited, please let us know and we can try to get it corrected before the nal version is printed. The MIT Press Cambridge, Massachusetts London, England
2022-09-15 09:55:26 10.96MB RL
1
Auto RL调研结果;答辩总结
2022-09-07 12:05:15 15.56MB AutoRL
1
RTL8189ES模块(RL-SM02B-8189ES)规格书
2022-08-20 09:37:58 1.32MB RTL8189ES RL-SM02B
1
mujoco200+mikey.txt,这两个资源在各个博客上给的链接都失效了,上传上来供大家学习spinning up时安装Mujoco使用
2022-07-22 18:06:54 4.15MB RL spinningup mujoco
1
适合于刚学习FBP重建算法,要加深对它的理解的同学。实验结果已经测试过。如购买后,有疑问,请联系iamxiaoyoung@yeah.net.
2022-07-21 14:06:17 3KB Python FBP
1
Easy-RL 李宏幽默老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂,他会通过很多有趣的例子例证解强化学习理论。某些老师经常会用玩Atari游戏的例子解释解解强化学习算法。如此,为了课程的补充,我们整理了周博磊老师的《强化学习纲要》,李科浇老师的《百度强化学习》。以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。 使用说明 第4章到第11章为的部分; 第1章和第2章根据整理而来; 第3章和第12章根据整理而来。 在线阅读(内容实时更新) 地址: : 内容导航 章节 习题 项目 算法代码实现一览 算法名称 相关论文材料 备注 进度 蒙特卡洛算法 好的 好的 好的 好的 DQN-cnn 与DQN索引使用了CNN而不是全链接网络 好的 好的 分层DQN 好的 好的 DDPG 好
1
人工智人-家居设计-RL智能安检设备制造公司市场营销策略研究.pdf
2022-07-03 19:03:45 818KB 人工智人-家居
matlab代码做游戏2048-rl 该存储库包含用于实施强化学习代理的代码,这些学习代理试图学习玩流行的游戏2048。该代码用C ++编写,试图使各种学习实验尽快运行。 我还提供了一些Matlab脚本来可视化结果。 编译和运行代码 要完成的第一步是编译代码。 要编译此存储库中包含的所有程序,只需打开一个终端,然后导航到包含代码的目录。 然后,执行make命令: 2048-rl$ make 如果只希望编译特定程序,也可以这样做。 例如,如果您希望编译qLearning程序,请运行以下命令: 2048-rl$ make qLearning 在存储库中编译完各种程序之后,您可以执行许多操作。 手动播放2048 程序play2048允许用户手动播放2048。该程序是作为对游戏环境的测试而创建的,但它本身仍然很有趣。 训练软件代理该项目的全部目的是为2048实施增强学习代理。您可以训练三种不同类型的软件代理: Q学习代理 时差学习代理(适用于游戏状态) 时差学习代理(适用于游戏后状态) 培训每个代理的程序分别是qLearning , stateLearning和afterStateLearni
2022-06-20 18:52:10 29KB 系统开源
1