搜索【dqn】的结果

Local-QMIX:针对具有局部性假设的MARL设置的一种新的改进的DQN算法。我们假设该问题具有一个基础的依赖关系图，该关系图连接了代理的相互作用

本地QMIX 针对具有局部性假设的MARL设置的一种新的改进的DQN算法。我们假设该问题具有一个基础的依赖关系图，该关系图连接了代理的相互作用

2022-07-28 16:37:23 4.37MB Python

1

深度强化学习+DQN+Pytorch+CartPole-v0

基于Pytorch实现的DQN算法，环境是基于CartPole-v0的。在这个程序中，复现了整个DQN算法，并且程序中的参数是调整过的，直接运行。 DQN算法的大体框架是传统强化学习中的Q-Learning，只不过是Q-learning的深度学习版本。DQN的改进主要有三个： 1. DQN的行为值函数利用神经网络逼近； 2. DQN维护一个回放缓冲区，将每次从环境中采样得到的四元组数据存储到回放缓冲区中，训练 Q 网络的时候再从回放缓冲区中随机采样若干数据来进行训练； 3. DQN使用目标网络，使得算法的训练更加稳定。

2022-07-14 12:08:28 8KB DQN 强化学习 CartPole Pytorch

1

深度强化学习+DoubleDQN+Pytorch+Pendulum-v0

普通的 DQN 算法通常会导致对值的过高估计，通过神经网络估算的Q值本身在某些时候会产生正向或负向的误差，在 DQN 的更新方式下神经网络会将正向误差累积。对于动作空间较大的任务，DQN 中的过高估计问题会非常严重，造成 DQN 无法有效工作的后果。为了解决这一问题，Double DQN 算法提出利用两个独立训练的神经网络估算值函数，将训练网络作为 Double DQN 算法中的第一套神经网络来选取动作，将目标网络作为第二套神经网络计算值，极大的缓解了DQN过估计的问题。这个程序完整实现了DoubleDQN算法，并且在Pendulum-v0环境上验证了过估计问题，可以从实验结果中看出，DoubleDQN确实缓解了DQN的过估计问题。

2022-07-14 12:08:28 11KB 强化学习 过估计 DQN DoubleDQN

1

easy-rl:强化学习中文教程，在线阅读地址：https

Easy-RL 李宏幽默老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂，他会通过很多有趣的例子例证解强化学习理论。某些老师经常会用玩Atari游戏的例子解释解解强化学习算法。如此，为了课程的补充，我们整理了周博磊老师的《强化学习纲要》，李科浇老师的《百度强化学习》。以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。使用说明第4章到第11章为的部分；第1章和第2章根据整理而来；第3章和第12章根据整理而来。在线阅读（内容实时更新）地址： : 内容导航章节习题项目算法代码实现一览算法名称相关论文材料备注进度蒙特卡洛算法好的好的好的好的 DQN-cnn 与DQN索引使用了CNN而不是全链接网络好的好的分层DQN 好的好的 DDPG 好

2022-07-11 07:32:44 135.33MB reinforcement-learning deep-reinforcement-learning q-learning dqn

1

深度强化学习.pptx

强化学习（Reinforcement Learning, RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一，用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题

2022-07-07 20:14:30 7.09MB 强化学习 深度学习 DQN Q学习

1

深度强化学习系列DQN

深度强化学习系列，包括最基础的DQN，DQN模型改进，DQN算法改进，分层DRL，基于策略梯度的深度强化学习等等

2022-06-30 18:10:51 72.23MB DQN

CNN_with_CAES_and_DQN:卷积神经网络的组合，其中卷积自动编码器（堆叠式）与深度 Q 网络相结合。 C++代码基于tiny_cnn

CNN_with_CAES_and_DQN 卷积神经网络的组合，其中卷积自动编码器（堆叠式）与深度 Q 网络相结合。 C++代码基于tiny_cnn

2022-06-29 21:18:19 728KB C++

1

rl-policies-attacks-defenses:深度强化学习（RL）的对抗性攻击

强化学习对抗攻击和防御 DQN政策战略定时攻击统一攻击对抗训练该存储库为深度强化学习代理实现了一些经典的对抗攻击方法，包括（ drl_attacks/ ）：统一攻击[]。战略定时攻击[]。临界点攻击[]。关键策略攻击。对抗性政策攻击[]。也可以使用以下RL防御方法（ drl_defenses/ ）：对抗训练[]。还提供了一些图像防御方法（ img_defenses/ ）： JPEG转换[]。位压缩[ ]。图像平滑[]。该项目大部分基于基于的RL框架守。图片敌对攻击和防御都与实施，也是基于Pytorch。相反，A2C和PPO策略基于pytorch-a2c-ppo-acktr-gail ，DQN使用了天守实现。任何图像对抗攻击都与此项目兼容。可用型号它还可以在文件夹log找到适用于不同任务的训练有素的模型。下表报告了三种

2022-05-31 21:56:45 256.42MB reinforcement-learning deep-reinforcement-learning pytorch dqn

1

用DQN完成5G网络中基站与用户的连接

DQN网络借鉴了IQL的思想，分布的动作，共同的状态

2022-05-23 16:08:24 119KB 网络 文档资料

1

RIS+UAV+DQN-Simulation_ris_深度增强学习_无人机_无人机通信_DQN

深度增强学习优化无人机航迹

2022-05-17 09:20:08 6.77MB ris 深度增强学习 无人机 无人机通信

个人信息

热门下载

最新下载

其他资源