只为小站
首页
域名查询
文件下载
登录
李升波-强化学习与控制-第七讲
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第七讲,主要介绍直接型RL的
策略梯度法
,包括各类Policy Gradient, 以及如何从优化的观点看待RL等。
2021-07-09 16:08:09
2.17MB
强化学习
最优控制
李升波教授
策略梯度法
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
vivado 破解 lisence(有效期到2037年) 下载
中国地面气候资料日值数据集(V3.0)2014-2019.zip
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
基于Servlet+jsp+mysql开发javaWeb学生成绩管理系统
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
房价预测的BP神经网络实现_python代码
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
安卓开发期末大作业----单词本(源码,任务书,大报告,apk文件)(基于andord studio)
opcua服务器模拟器+opcua客户端工具.rar
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
scratch版 我的世界.sb2
雷达信号处理仿真程序(MTI,MTD等)
C4.5决策树算法的Python代码和数据样本
新型冠状病毒疫情_2020年东三省数学建模A题_论文展示
最新下载
考虑粗糙度的混合润滑.rar
诺威达K2201刷机包,10.0版本,解决蓝牙不连接,放音乐一会就断
extjs6.5.3去水印版
Extjs-6.6.0去水印版
Magisk模块:Move_Certificates-v1.9
C++光线跟踪
labview工具包 LV_Multisim_Toolkit
E4AQQ浏览器内核类库.zip
c3560e-universalk9-mz.152-4.E10.bin
PA1100磁头解码芯片源代码
其他资源
C++ Builder 6.0 基础教程
基于GIS的TauDEM软件包
小游戏(vs2008 游戏代码)
Microsoft 70-742題庫
openGL正方体贴图
DataFountain 互联网新闻情感分析数据集
MVC++环境2005-2017全部一键安装包x86 x64
unity3d 美食游戏模板
Windows图形编程·清晰版PDF + 源码
Android AudioRecorder录制mp3文件(已经完整封装好,直接调用)
STM32红外遥控解码程序解码后的按键值通过串口打印到PC机终端.rar
python 版本的k-means算法
最新多家大公司整理的350道Java面试题手册.pdf
决策树_ID3算法.docx
game网站.url
NoteStation-x86_64-2.5.5-0870.spk
山西大学《数据库》软工历年考研试卷(含答案).pdf
PWM控制器UC3825在1MHz/100W功率信号源中的应用
abc.zip快速下载通道
redis-sentinel.conf
ftp文件上传jar
MASM611:汇编编译工具masm
纯电动客车动力系统仿真
labview数据采集 触发采集
四路带打分计时功能的抢答器