只为小站
首页
域名查询
文件下载
登录
c++复现标准版的策略梯度算法内含数据集以及训练预测脚本
策略梯度(Policy Gradient, PG)方法的核心思想在于是能获得更好的回报的动作的采样概率不断提高,使获得更少回报的动作的采样概率不断降低,从而达到一个最优的策略。
2022-10-22 09:07:51
7KB
libtorch
vpg
DeepReinforcementLearning:深度RL实施。 在pytorch中实现的DQN,SAC,DDPG,TD3,PPO和
VPG
。 经过测试的环境:LunarLander-v2和Pendulum-v0-源码
使用Pytorch实现的深度RL算法 算法列表: 关于深入探讨 实验结果: 算法 离散环境:LunarLander-v2 连续环境:Pendulum-v0 DQN --
VPG
-- DDPG -- TD3 -- SAC -- PPO -- 用法: 只需直接运行文件/算法。 在我学习算法时,它们之间没有通用的结构。 不同的算法来自不同的来源。 资源: 未来的项目: 如果有时间,我将为使用RL的电梯添加一个简单的程序。 更好的图形
2021-04-26 01:35:45
391KB
algorithms
ddpg
sac
ppo
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
张正友相机标定Opencv实现(完整程序+棋盘图)实例源码
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
狂神说全部笔记内容.zip
基于OpenCV的车牌号码识别的Python代码(可直接运行)
得到品控手册7.0.pdf
多智能体的编队控制matlab程序(自己编写的,可以运行)
Plexim Plecs Standalone 4.1.2 x64.7z
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
东南大学英语技术写作慕课所有答案
JPEG的Matlab实现
EEMD算法应用于信号去噪.rar
java-spring-web-外文文献翻译40篇.zip
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
最新下载
蓝桥杯历年试题(附完整测试数据和题目描述,可导入Oj)
betwin836一拖二
so加固(包括section加密&&so的函数加密).zip
at20000分色软件
宏华f分色软件
iperf V2.0.5 ,图形可视化版
DSPC2000controlsuite
Webots User Guide
VcXsrv Windows X Server vcxsrv-64.1.20.8.1.installer
LaTeX2e 文类和宏包学习手册.pdf
其他资源
c语言简易飞秋
分数阶混沌程序
Fracturing & Destruction v1.15.unitypackage
hillstone secure connect Mac版
MFC入门教程(完整整合版)
飞机纵向模态程序
oracle测试表,emp,dept,salgrade建表语句mysql版
C#教务管理系统代码
VMware+VSAN权威指南(中文版).pdf
IEC 62196-2
gradle-3.3-all.zip 下载 绿色版
Python爬取正方教务系统成绩
matlab初学者的60个小程序示例
2020医疗健康物联网技术与应用研究报告.pdf
温度采集好12313123.rar
ISO/IEC 17000:2020 合格评定 - 词汇和通用原则 - 最新2020完整英文版(50页)
numpy-1.13.3+mkl-cp34-cp34m-win_amd64.whl
Android 天气预报
Qt Creator快速入门
微机原理与接口技术论文
安卓签名打包AndroidKille
多人多准则模糊层次分析法的物流中心综合评价优选模型
step7 例程100个
SetupTropesVF820法语词频分析软件
BinCompiler
stm32f767igt6引脚功能规划