只为小站
首页
域名查询
文件下载
登录
李升波-强化学习与控制-第十一讲
清华大学智能驾驶实验室官网:http://www.idlab-tsinghua.com/thulab/labweb/index.html 本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十一讲,主要介绍RL的各类拾遗,包括POMDP、鲁棒性、多智能体、元学习、逆强化学习以及训练平台等。
2021-07-09 21:06:30
4.5MB
强化学习
最优控制
POMDP
李升波教授
1
李升波-强化学习与控制-第三讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第三讲,主要介绍免模型学习的蒙特卡洛法,包括Monte Carlo估计,On-policy/off-policy,重要性采样等。
2021-07-09 21:06:26
2.63MB
强化学习
最优控制
蒙特卡洛法
李升波教授
1
李升波-强化学习与控制-第五讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第五讲,主要介绍介绍带模型学习的动态规划法,包括策略迭代、值迭代、收敛性原理等。
2021-07-09 16:08:10
3.42MB
强化学习
最优控制
动态规划
李升波教授
1
李升波-强化学习与控制-第六讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第六讲,主要介绍间接型RL的函数近似方法,包括常用近似函数,值函数近似,策略函数近似以及所衍生的Actor-critic架构等。
2021-07-09 16:08:09
2.31MB
强化学习
最优控制
李升波教授
间接型RL
1
李升波-强化学习与控制-第七讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的策略梯度法,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
2021-07-09 16:08:09
2.17MB
强化学习
最优控制
李升波教授
策略梯度法
1
李升波-强化学习与控制-第八讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第八讲,主要介绍深度强化学习,即以神经网络为载体的RL,包括深度化典型挑战、经验性处理技巧等。
2021-07-09 16:08:08
3.87MB
强化学习
最优控制
李升波教授
深度强化学习
1
李升波-强化学习与控制-第九讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第九讲,主要介绍带模型的强化学习,即近似动态规划,包括离散时间系统的ADP,ADP与MPC的关联分析等。
2021-07-09 16:08:08
2.41MB
强化学习
最优控制
近似动态规划
李升波教授
1
李升波-强化学习与控制-第十讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十讲,主要介绍有限时域的近似动态规划,同时介绍了状态约束的处理手段以及它与可行性之间的关系。
2021-07-09 16:08:07
3.49MB
强化学习
最优控制
近似动态规划
李升波教授
1
李升波-强化学习与控制-第一讲
本课程为清华大学强化学习与控制,由清华大学长聘教授李升波主讲,共十一讲,本讲为第一讲,主要介绍RL概况,包括发展历史、知名学者、典型应用以及主要挑战等。
2021-07-09 16:08:04
3.7MB
强化学习
最优控制
李升波教授
强化学习概况
1
李升波-强化学习与控制-第四讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第四讲,主要介绍免模型学习的时序差分法,包括它衍生的Sarsa,Q-learning,Expected Sarsa等算法。
2021-07-09 16:08:03
2.4MB
强化学习
最优控制
时序差分法
李升波教授
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
RentingSystem.rar
狂神说Java系列笔记.rar
YOLOv5 人脸口罩图片数据集
多目标优化算法(四)NSGA3的代码(python3.6)
MATLAB车牌识别系统
智能微电网中利用粒子群算法实现多目标优化(有完整数据可运行).zip
基于STM32的电子时钟设计
大唐杯资料+题库(移动通信)
随机森林用于分类matlab代码
故障诊断数据集及实现代码
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
RNN-LSTM卷积神经网络Matlab实现
voc车辆检测数据集(已处理好,可直接训练)
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
最新下载
小蚁智能摄像头夜视版(YHS-113)固件升级包
AccessToExcel access导出到excel软件 v3.4官方版
MIPS数字标牌信息发布系统_标准版本_FREE V4.0.0.zip
T440P的bios二进制烧写文件
php-fpm-5.4.16-46.el7.x86_64.rpm
华为E5375三网五模固件及教程.7z
最新版瑞美检验注册机瑞美4.91注册码注册机下载
瑞美4.91单机版
DRV2605L触觉电机控制板原理图/PCB/demo程序-电路方案
用于 LK-G 系列设置和 支持软件 LK-Navigator
其他资源
基于 Python 实现微信公众号爬虫
网上订票系统代码
python快排全套带环境前后端.zip
labview信号谐波基音提取检测
2018年中国研究生数学建模大赛A题优秀论文
基于VS2010的全局低级键盘钩子Hook demo
MSM8953 datasheet device spec(1).pdf
spss19 视频教程以及案例数据集迅雷下载地址
托盘区完美菜单(au3源码)
dotfiles:我的备份配置dotfiles-源码
iOS Meme版本1:iOS开发人员纳米度Meme编辑器版本1-源码
haozip_v5.9.7.exe
Tomcat日志仅供日志解析使用
五子棋对战[网络版].rar
数字信号处理大作业
OPNET_Modeling Wireless仿真
空间插值算法
react-后台管理系统
实现一对一的聊天程序设计
光学 赵凯华 答案 详细版
7001端口抓鸡抓服务器教程
TypeLibraryExplorer.zip
Android美工坊--一个QQ登录验证的小例子