控制系统的应用中存在状态不能直接测量或测量成本高的实际问题,给模型参数未知的系统完全利用状态数据学习最优控制器带来挑战性难题.为解决这一问题,首先构建具有状态观测器且系统矩阵中存在未知参数的离散线性增广系统,定义性能优化指标;然后基于分离定理、动态规划以及Q-学习方法,给出一种具有未知模型参数的非策略Q-学习算法,并设计近似最优观测器,得到完全利用可测量的系统输出和控制输入数据的非策略Q-学习算法,实现基于观测器状态反馈的系统优化控制策略,该算法的优点在于不要求系统模型参数全部已知,不要求系统状态直接可测,利用可测量数据实现指定性能指标的优化;最后,通过仿真实验验证所提出方法的有效性.
1
自适应滤波3 - 第三章最小均方(LMS)算法.ppt
2022-05-27 14:08:14 818KB 算法 文档资料
自适应遗传算法在多模图像配准中的应用.doc
2022-05-27 14:08:13 279KB 文档资料
人工智能-项目实践-自适应学习-使用Q学习进行水声通信的自适应调制 使用Q学习进行水声通信的自适应调制 动作为调制方式,有BPSK、QPSK、8PSK三种,每种调制都有高功耗发射和低功耗发射两种模式。 状态为已使用的能量,信噪比和状态有关且加了一定程度的随机性
人工智能-项目实践-自适应学习-自适应学习模型-应用于教育领域-知识图谱 run this demo $python train_dkt.py --dataset ../data/assistments.txt
人工智能-项目实践-自适应学习-使用强化学习来实现旋转门算法参数的自适应 使用强化学习来实现旋转门算法参数的自适应
一种新的自适应PID控制算法.doc
2022-05-25 19:06:43 42KB 文档资料
一种自适应二维数字水印算法.doc
2022-05-25 19:06:40 584KB 算法 文档资料
bootstrap实现响应式自适应导航栏,并实现平滑滚动
2022-05-25 18:47:51 4KB Java TE网络
1
东北大学现代控制系统考试资料整理,整理自讲义,考试必备
2022-05-25 09:17:29 4.2MB 自适应控制
1