搜索【ddpg源码】的结果

ddpg源码

2021-12-24 11:01:46 2KB ddpg源码

RLContinuousActionSpace:在连续状态和动作空间中进行强化学习。 DDPG-源码

RLContinuousActionSpace 在连续状态和动作空间中进行强化学习。 DDPG：深度确定性策略梯度和A3C：异步Actor-Critic代理注意：环境是随机填充的查找表和模拟物理模型的常量的任意组合。 1°DDPG：基于带有深度强化学习的持续控制：：和来自精彩博客。这种方法结合了DDQN算法（体验重播和目标网络）的优势以及可输出连续动作的行为者批评结构。该算法首先在健身房开放式平台的pendulum-v0游戏中进行了验证，然后应用于定制的Envonement EnvPlant.py，模拟了温度模型： OU.py：探索是通过Ornstein-Uhlenbeck过程完成的，它具有便利的均值回复特性。 Models.py：演员，评论家和目标网络的神经网络演员模型批评模型 main.py：配置，训练，测试，显示，存储，加载 ReplayBuffer.py

2021-11-19 17:06:34 1.9MB Python

1

ddpg-源码

ddpg

2021-03-14 18:42:30 2KB Python

1

个人信息

热门下载

最新下载

其他资源