只为小站
首页
域名查询
文件下载
登录
基于排序优先
经验回放
的竞争深度Q网络学习
为减少深度Q网络(DQN)算法的训练时间,采用结合优先
经验回放
机制与竞争网络结构的DQN方法,针对Open AI Gym平台cart pole和mountain car两个经典控制问题进行研究,其中
经验回放
采用基于排序的机制,而竞争结构中采用深度神经网络。仿真结果表明,相比于常规DQN算法、基于竞争网络结构的DQN方法和基于优先
经验回放
的DQN方法,该方法具有更好的学习性能,训练时间最少。同时,详细分析了算法参数对于学习性能的影响,为实际运用提供了有价值的参考。
2022-04-13 10:50:11
1.3MB
强化学习
深度Q网络
竞争网络
1
A Novel DDPG Method with Prioritized Experience__Replay.rar
A Novel DDPG Method with Prioritized Experience__Replay.rar
2021-04-08 21:02:40
17.39MB
强化学习
DDPG
经验回放
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
MATLAB之LSTM预测
2019和2021年华为单板通用硬件笔试题及答案
基于hadoop商品推荐系统课程设计
mingw-w64-install.exe
校园网规划与设计(报告和pkt文件)
BP_PID控制仿真.rar
机械臂避障路径规划仿真 蚁群算法 三维路径规划
EasyMedia-ui.zip
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
多目标优化算法(四)NSGA3的代码(MATLAB)
python爬虫数据可视化分析大作业.zip
基于MATLAB的水果图像识别
DBSCAN算法Matlab实现
拾荒者扫描器.rar
狂神说Java系列笔记.rar
最新下载
编译原理课程设计
SWF Encrypt 4.0.4 汉化版
Doc_9689_确定最小间隔的空域规划方法手册
unity博物馆.zip
武汉大学-朱卫平-商务智能-作业1.zip
爬取微信小程序源码工具
Turbo与LDPC编解码及其应用-肖扬
WCDMA SIB消息
IEEE的论文模板
速达全系列通用免狗补丁完美终结版
其他资源
TwinCAT2.0从入门到精通V2.02
Edmonds算法Python版
Qt多线程通信 附源码demo
Tiled-1.0.2 for mac.dmg.zip
格林函数的公式matlab仿真
raytracegroundup_v5.0_RayTracing_Scenes_TwoHorses_20170411
【DNF开源登录器】Dnf登录器源码配套数据.rar
小说分析软件
mondo Rescue 离线包
09年全国大学生电子设计大赛论文合集
MSP430F149利用硬件SPI口读写串行Flash M25P64
openssh85.zip
材料力学2004年硕士研究生入学考试试题.rar
易网自助建站系统 5.0
算法实现题3-1独立任务调度问题答案
东北大学软英数据结构实验
comsol 仿真
C# 仿迅雷源码
linux进程监控和进程守护程序