只为小站
首页
域名查询
文件下载
登录
李升波-强化学习与控制-第十一讲
清华大学智能驾驶实验室官网:http://www.idlab-tsinghua.com/thulab/labweb/index.html 本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十一讲,主要介绍RL的各类拾遗,包括POMDP、鲁棒性、多智能体、元学习、逆强化学习以及训练平台等。
2021-07-09 21:06:30
4.5MB
强化学习
最优控制
POMDP
李升波教授
1
李升波-强化学习与控制-第三讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第三讲,主要介绍免模型学习的蒙特卡洛法,包括Monte Carlo估计,On-policy/off-policy,重要性采样等。
2021-07-09 21:06:26
2.63MB
强化学习
最优控制
蒙特卡洛法
李升波教授
1
李升波-强化学习与控制-第五讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第五讲,主要介绍介绍带模型学习的动态规划法,包括策略迭代、值迭代、收敛性原理等。
2021-07-09 16:08:10
3.42MB
强化学习
最优控制
动态规划
李升波教授
1
李升波-强化学习与控制-第六讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第六讲,主要介绍间接型RL的函数近似方法,包括常用近似函数,值函数近似,策略函数近似以及所衍生的Actor-critic架构等。
2021-07-09 16:08:09
2.31MB
强化学习
最优控制
李升波教授
间接型RL
1
李升波-强化学习与控制-第七讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的策略梯度法,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
2021-07-09 16:08:09
2.17MB
强化学习
最优控制
李升波教授
策略梯度法
1
李升波-强化学习与控制-第八讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第八讲,主要介绍深度强化学习,即以神经网络为载体的RL,包括深度化典型挑战、经验性处理技巧等。
2021-07-09 16:08:08
3.87MB
强化学习
最优控制
李升波教授
深度强化学习
1
李升波-强化学习与控制-第九讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第九讲,主要介绍带模型的强化学习,即近似动态规划,包括离散时间系统的ADP,ADP与MPC的关联分析等。
2021-07-09 16:08:08
2.41MB
强化学习
最优控制
近似动态规划
李升波教授
1
李升波-强化学习与控制-第十讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十讲,主要介绍有限时域的近似动态规划,同时介绍了状态约束的处理手段以及它与可行性之间的关系。
2021-07-09 16:08:07
3.49MB
强化学习
最优控制
近似动态规划
李升波教授
1
李升波-强化学习与控制-第一讲
本课程为清华大学强化学习与控制,由清华大学长聘教授李升波主讲,共十一讲,本讲为第一讲,主要介绍RL概况,包括发展历史、知名学者、典型应用以及主要挑战等。
2021-07-09 16:08:04
3.7MB
强化学习
最优控制
李升波教授
强化学习概况
1
李升波-强化学习与控制-第四讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第四讲,主要介绍免模型学习的时序差分法,包括它衍生的Sarsa,Q-learning,Expected Sarsa等算法。
2021-07-09 16:08:03
2.4MB
强化学习
最优控制
时序差分法
李升波教授
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
狂神说Java系列笔记.rar
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
voc车辆检测数据集(已处理好,可直接训练)
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
狂神说全部笔记内容.zip
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
先进PID控制Matlab仿真第4版-PDF+代码.zip
基于STM32的电子时钟设计
王万良-人工智能导论(第五版)课件
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
全国河流水文站坐标.xls
银行笔试 信息科技岗部分真题
多智能体的编队控制程序的补充(之前上传少了一个文件)
最新下载
labview工具包 LV_Multisim_Toolkit
E4AQQ浏览器内核类库.zip
c3560e-universalk9-mz.152-4.E10.bin
PA1100磁头解码芯片源代码
LDN系列蓝牙双模键盘和有线键盘的驱动软件(2021-04-02)
常用电路设计方案
硬盘序列号修改工具 任意修改
基于PYNQ的BNN重建项目-lfcW1A1
SUP80 V4.5.2.rar
ST电调方案
其他资源
bes查看工具
密码模块安全技术要求《GM/T 0028-2014 》
自动机理论、语言和计算导论(原书第3版)pdf
实战华为交换机路由器实验指导书(绝佳经典)
C# 学生选课系统~附上数据库
六自由度数学模型matlab
C++实现从麦克风读入音频并保存
电压电流检测模块.zip
前端 纯html js 调用相机识别二维码
开源CRM管理系统-ThinkPHP5+Bootstrap
R-Studio数据恢复(附注册码)
【图形处理相关的jar包】jai-imageio-1.1.jar和swingx-1.6.1.jar下载
练习:基于c语言的8位二进制原码一位乘法
方程式赛车转向
消毒液家居家用品消毒液详情页设计模板.zip
南京理工大学2019年随机信号处理试卷
一个只有99行代码的JS流程框架
Todo_list_vuejs-源码
qq_add_friend2020.rar
美能达3010 64位驱动.zip
腾讯游戏封号查询V2.75.rar
vb五子棋源代码
大连理工大学ACM课件