概述 这是关于强化学习的注释和示例的集合。 这些内容基于Richard S. Sutton和Andrew G. Bartow撰写的《》第二版。 内容 该存储库中包含以下注释和示例: 第2章-多臂强盗 第三章-有限马尔可夫决策过程 第4章-动态编程 第5章-蒙特卡洛方法 笔记 二十一点 解决二十一点 二十一点状态值的非政策估计 无限方差 赛马场 第六章-时差学习 笔记 随机游走 批量更新下的随机游走 风之网格世界 悬崖漫步
2021-10-25 19:20:27 5.48MB F#
1
用Java进行动手强化学习[视频] 这是出版的的代码库。 它包含从头到尾完成视频课程所需的所有支持项目文件。 关于视频课程 数据科学和机器学习世界中存在无法通过监督学习或无监督学习解决的问题。 如果标准ML工程师的工具包不够用,您可以学习和使用一种新方法:强化学习。 本课程重点介绍Java生态系统中的关键强化学习技术和算法。 每个部分都涵盖了RL概念并解决了实际问题。 您将学习解决具有挑战性的问题,例如创建机器人,决策,随机悬崖行走等等。 然后,您还将涵盖深度强化学习,并学习如何在RL算法中使用DeepLearning4J添加深度神经网络。 在本课程结束时,您将准备解决强化学习问题,并利用最强大的Java DL库创建强化学习算法。 您将学到什么 利用ND4J和RL4J进行强化学习 使用马尔可夫决策过程解决购物车极点问题 使用QLConfiguration来配置您的强化学习算法 利用动
2021-10-25 19:14:42 21.71MB Java
1
红绿灯交通学习 需要做的事情: 安装FLOW框架-https: 安装SUMO- //sumo.dlr.de/docs/Downloads.php或遵循FLOW安装 然后,将custom_traffic_light_env.py放入envs文件夹(/ flow / flow / envs)下的FLOW文件夹中。 通过添加以下内容来修改envs文件夹的init.py: 从flow.envs.custom_traffic_light_env导入CustomTrafficLightEnv, CustomTrafficLightPOEnv,CustomTrafficLightTestEnv,CustomTrafficLightBenchmarkEnv 全\u90e8='CustomTrafficLightEnv','CustomTrafficLightPOEnv','CustomTrafficLig
2021-10-25 17:23:36 436KB Python
1
深度强化学习代码 当前,这里只有用于分布增强学习的代码。 C51,QR-DQN和IQN的代码与略有。 QUOTA是基于算法作者同的工作而实现的。 我最近注意到,我的DQN代码可能无法获得理想的性能,而其他代码却运行良好。 如果有人可以指出我的代码中的错误,我将不胜感激。 随时进行聊天-如果您想讨论任何事情,请给我发送电子邮件。 依赖关系: pytorch(> = 1.0.0) 体育馆(= 0.10.9) 麻木 matplotlib 用法: 为了运行我的代码,您需要在主目录下创建两个子目录:./data/model/&./data/plots/。 这两个目录用于存储数据。 当计算机的python环境满足上述依赖性时,您可以运行代码。 例如,输入: python 3_ iqn . py Breakout 在命令行上运行以在Atari环境中运行算法。 您可以为代码内的算法更改一些特定参数。 训练后,您可以通过使用适当的参数运行result_show.py来绘制结果。 参考文献: 通过深度强化学习(DQN)进行人为控制[] [] 强化学习的分布式视角(C51)[] []
1
强化学习以控制交通 这是我们的毕业项目“交通信号控制培训强化学习代理” 因此,我们使用强化学习来控制交通信号,并使用模拟城市交通(SUMO)来模拟交通网络,我们使用Traci [python脚本]进行强化学习和SUMO之间的通信 生成路由文件 此命令将生成包含许多汽车类型的路线,具体取决于map/4-way/Rou_File/vTypeDistributions.add.xml 该命令将生成路由文件: python randomTrips.py -n ./36-way/36-way.net.xml -r ./36-way/route/Period_3.rou.xml -e 6000 -l --validate --fringe-factor 10 --period 0.8 --trip-attributes="departLane=\"best\" departSpeed=\"rand
2021-10-22 20:15:41 1.3MB Python
1
使用深度增强学习玩Atari游戏,不错的论文,值得一看,想快下
2021-10-21 08:20:20 472KB AI DRL Atari
1
强化学习解决方案第二版(Richard S. Sutton的,Andrew G. Barto) 第12章已更新。 有关详细信息,请参见下面的日志。 那些正在使用它来完成您的作业的学生,​​请停止该作业。 本手册旨在为数百万没有官方指南或适当学习环境的自学人士提供服务。 而且,当然,作为个人项目,它会出现错误。 (如果发现任何问题,则有助于解决问题)。 欢迎来到这个项目。 这是一个很小的项目,我们还没有做太多的编码,但是我们一起合作完成了著名的RL书籍《强化学习》(萨顿的介绍)中的一些棘手的练习。 您可能知道这本书,尤其是去年出版的第二版,没有正式的解决方案手册。 如果将答案发送到作者留下的电子邮件地址,则将返回不完整且较旧的伪造答题纸。 那么,为什么我们不写我们自己的呢? 大多数问题都是数学证明,可以很好地学习理论主干,但其中一些是颇具挑战性的编码问题。 两者都将逐渐更新,但数学将排在第
1
cliff_walking_python-强化学习- Q学习,SARSA
2021-10-20 21:59:28 2KB
1
CS234_强化学习 斯坦福大学CS234冬季课程2019作业 讲课讲座可以在这里看到: 讲义可以在这里下载:
2021-10-17 16:28:00 30.87MB reinforcement-learning stanford cs234 Python
1
Reinforcement-learning-with-tensorflow-master.zip
2021-10-14 16:16:32 421KB reinforcement learning
1