搜索【DQN】的结果

DQN-雅达利深度Q网络实现。实施从论文《和得出。结果游戏视频-DQN Nature Paper 每集奖励实施摘要 DQN自然架构实施输入：84×84×4图像（使用历史记录的最后4帧）转换层1：32个8×8滤光片，步幅为4 转换层2：64个4×4步幅的滤镜转换层3：64个3×3滤光片，步幅为1 完全连接1：完全连接，由256个整流器单元组成输出：完全连接的线性层，每个有效动作均具有单个输出。 DQN Neurips架构实施输入：84×84×4图像（使用历史记录的最后4帧）转换层1：16个8×8滤光片，步幅为4 转换层2：32个4×4步幅的滤镜完全连接1：完全连接，由256个整流器单元组成输出：完全连接的线性层，每个有效动作均具有单个输出。其他参数优化器：RMSProp 批量大小：32 电子贪婪：0.1 怎么跑创建一个新环境例子： conda

2021-10-28 09:30:51 19.97MB machine-learning reinforcement-learning pong pytorch

1

DeepRL_PyTorch：用于研究的深度强化学习代码。当前，仅存在算法代码：DQN，C51，QR-DQN，IQN和QUOTA-源码

深度强化学习代码当前，这里只有用于分布增强学习的代码。 C51，QR-DQN和IQN的代码与略有。 QUOTA是基于算法作者同的工作而实现的。我最近注意到，我的DQN代码可能无法获得理想的性能，而其他代码却运行良好。如果有人可以指出我的代码中的错误，我将不胜感激。随时进行聊天-如果您想讨论任何事情，请给我发送电子邮件。依赖关系： pytorch（> = 1.0.0）体育馆（= 0.10.9）麻木 matplotlib 用法：为了运行我的代码，您需要在主目录下创建两个子目录：./data/model/＆./data/plots/。这两个目录用于存储数据。当计算机的python环境满足上述依赖性时，您可以运行代码。例如，输入： python 3_ iqn . py Breakout 在命令行上运行以在Atari环境中运行算法。您可以为代码内的算法更改一些特定参数。训练后，您可以通过使用适当的参数运行result_show.py来绘制结果。参考文献：通过深度强化学习（DQN）进行人为控制[] [] 强化学习的分布式视角（C51）[] []

2021-10-24 22:54:36 33KB algorithm reinforcement-learning algorithms pytorch

1

强化学习入门经典论文（DQN相关）.rar

强化学习必读论文

2021-10-23 22:42:26 13.6MB DQN

1

强化学习源码（DP, MC, TD, DQN, PG, AC, A3C, DDPG）.zip

包括DP, MC, TD, TD-lambda, DQN, PG, AC, A3C, DDPG, Dyna_Q, Bandit, AlphaGoBangZero以及部分仿真游戏源码

2021-10-14 16:17:05 32.58MB 强化学习

1

DQN_by_keras-master.rar

用keras搭建DQN网络，实现走迷宫

2021-10-13 18:04:09 13KB 强化学习 迷宫 DQN

1

2018-surf-dqn-forex:XJTLU SURF项目-源码

金融投资组合选择和自动交易中的Q学习 Policy Gradient和Q-Learning是强化学习（机器学习的一个分支）中的技术，而后者由于在视频游戏和与人类专家进行的Game of Go比赛中的胜利而具有较高的知名度。但是，由于问题学习中连续的行动空间，强化学习在金融投资组合管理问题上的成功应用以前大多限于“策略梯度”变体。在这个项目中，我们将采用一种简单的离散化方案，以使问题适合于不连续的Q学习技术。然后，将通过其在其他更成熟的方法上的性能来检验这种方法的有效性。可能的方法使用使用使用从零开始的代码 ...

2021-10-11 17:03:40 2.08MB Python

1

keras搭建DQN训练Flappybird模型.zip

keras搭建DQN，构建FlappyBird智能体的模型，分别训练200轮以及github上下载的292轮模型

2021-09-30 17:05:25 21.23MB keras

1

强化学习DQN

这本书详细介绍了强化学习的常用算法以及算法原理，从蒙特卡罗方法到Q_learning最终到DQN

2021-09-28 19:29:44 1.51MB 强化学习 深度学习

1

machin:专为PyTorch设计的强化学习库（框架），实现了DQN，DDPG，A2C，PPO，SAC，MADDPG，A3C，APEX，IMPALA ..-源码

可读，可重用，可扩展 Machin是为pytorch设计的增强库。支持的型号任何事物，包括循环网络。支持的算法当前，Machin已实现以下算法，该列表仍在增长：单代理算法：多主体算法：大规模并行算法：增强功能：支持的算法：进化策略基于模型的方法特征 1.可读与其他强化学习库（例如著名的，和。 Machin尝试仅提供RL算法的简单明了的实现。 Machin中的所有算法均以最小的抽象设计，并具有非常详细的文档以及各种有用的教程。 2.可重复使用 Machin采用与pytorch类似的方法，将算法和数据结构封装在自己的类中。用户无需设置一系列data collectors ， trainers ， runners ， samplers ...即可使用它们，只需导入即可。模型上的唯一限制是它们的输入/输出格式，但是，这些限制很小，可以轻松地使算法适

2021-09-17 19:09:16 1.54MB python reinforcement-learning deep-learning gae

1

Reinforcement-Learning:使用Q学习，DQN和DDQN进行强化学习-源码

强化学习深度学习：优化创建人：Vithurshan Vijayachandran和Hisho Rajanathan RLearning_NOTEBOOK.ipynb-适用于基本（Q学习）和高级任务（DQN和DDQN）的Jupyter笔记本。 RL_Rport.pdf：报告所有研究结果和评估。使用以下预训练模型来测试网络，因为重新训练非常耗时。 DQNTrainingModel.h5-测试DQN网络所需的文件 DDQNTrainingModel.h5-测试DDQN网络所需的文件 DDQNPERTrainingModel.h5 =使用PER网络测试DDQN所需的文件

2021-09-14 10:57:27 2.5MB JupyterNotebook

1

个人信息

热门下载

最新下载

其他资源