提出一类非线性不确定动态系统基于强化学习的最优控方法. 该方法利用欧拉强化学习算法估计对象的未知非线性函数, 给出了强化学习中回报函数和策略函数迭代的在线学习规则. 通过采用向前欧拉差分迭代公式对学习过程中的时序误差进行离散化, 实现了对值函数的估计和控策略的改进. 基于值函数的梯度值和时序误差指标值, 给出了该算法的步骤和误差估计定理. 小车爬山问题的仿真结果表明了所提出方法的有效性.

1
信奥中的数学 数论 第7讲 进位.pdf
2022-07-16 14:03:34 104KB 信奥中的数学 数论 NOIP CSP-J
1
HGT 20592-2009 化工钢 管法兰 (PN系列) 要查询的标准
2022-07-14 13:24:46 9.16MB HGT 20592-2009 化工钢制 管法兰
1
ICP-网络与信息安全保障措施-2全文共2页,当前为第1页。ICP-网络与信息安全保障措施-2全文共2页,当前为第1页。信息安全管理责任 ICP-网络与信息安全保障措施-2全文共2页,当前为第1页。 ICP-网络与信息安全保障措施-2全文共2页,当前为第1页。 网络与信息的安全不仅关系到公司正常业务的开展,还将影响到国家的安全、社会的稳定。我司将认真开展网络与信息安全工作,通过检查进一步明确安全责任,建立健全的管理度,落实技术防范措施,保证必要的经费和条件,对有毒有害的信息进行过滤、对用户信息进行保密,确保网络与信息安全。 一、网站运行安全保障措施 1、网站服务器和其他计算机之间设置经公安部认证的防火墙, 并与专业网络安全公司合作,做好安全策略,拒绝外来的恶意攻击,保障网站正常运行。 2、在网站的服务器及工作站上均安装了正版的防病毒软件,对计算机病毒、有害电子邮件有整套的防范措施,防止有害信息对网站系统的干扰和破坏。 3、做好生产日志的留存网站具有保存60天以上的系统运行日志和用户使用日志记录功能,内容包括IP地址及使用情况,主页维护者、邮箱使用者和对应的 IP地址情况等。 4、交
2022-07-14 09:05:05 27KB 文档资料
1安全生产责任执行情况考核表.doc
2022-07-13 21:05:44 204KB 考试
1安全生产责任档案.doc
2022-07-13 21:05:43 147KB 考试
1安全责任A.doc
2022-07-13 21:05:43 38KB 考试
河长管理信息化系统项目建设方案.docx
2022-07-13 18:09:28 192KB 智慧
13各级管理人员安全生产责任.doc
2022-07-12 20:06:47 76KB 考试
123安全生产责任岗位职责DOC40页.doc
2022-07-12 16:05:07 114KB 考试