针对一类未知的连续非线性系统, 提出一个基于单网络近似动态规划(ADP) 的近似最优控制方案. 该方
案通过设计一个新型的递归神经网络(RNN) 辨识器放松了系统模型需已知或部分已知的要求, 并利用一个神经网
络(NN) 近似系统的性能指标函数消除了常规ADP方法中的控制网络. 通过Lyapunov 理论分析严格证明了闭环系
统内所有信号一致最终有界, 并且所获得的性能指标函数和控制输入分别收敛到最优性能指标函数和最优控制输入
的小邻域内. 仿真结果验证了所提出控制方案的有效性.

1
自适应动态规划(近似动态规划)——ADP MATLAB_MATLAB编程
1
控制系统的应用中存在状态不能直接测量或测量成本高的实际问题,给模型参数未知的系统完全利用状态数据学习最优控制器带来挑战性难题.为解决这一问题,首先构建具有状态观测器且系统矩阵中存在未知参数的离散线性增广系统,定义性能优化指标;然后基于分离定理、动态规划以及Q-学习方法,给出一种具有未知模型参数的非策略Q-学习算法,并设计近似最优观测器,得到完全利用可测量的系统输出和控制输入数据的非策略Q-学习算法,实现基于观测器状态反馈的系统优化控制策略,该算法的优点在于不要求系统模型参数全部已知,不要求系统状态直接可测,利用可测量数据实现指定性能指标的优化;最后,通过仿真实验验证所提出方法的有效性.
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第九讲,主要介绍带模型的强化学习,即近似动态规划,包括离散时间系统的ADP,ADP与MPC的关联分析等。
1
本课程为强化学习与控制,由清华大学开设,长聘教授李升波主讲,共十一讲,本讲为第十讲,主要介绍有限时域的近似动态规划,同时介绍了状态约束的处理手段以及它与可行性之间的关系。
1