只为小站
首页
域名查询
文件下载
登录
求解部分可观测
马氏决策
过程的强化学习算法
针对部分可观测
马氏决策
过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
2021-06-25 14:28:18
339KB
强化学习 部分可观测M
arkov
决策过程 Sarsa
学习 无记忆策略
1
马尔可夫决策过程引论
马氏决策
的好书,可用于Internet流量分析建模,无线网络资源分配建模
2019-12-21 19:35:18
6.05MB
马氏决策
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf
DS证据理论的MATLAB案例程序源代码
极域电子教室管理系统软件V2.0 2022稳定版 支持Win11
Plex v7.12电视端app
PLECS中文手册.pdf
多目标优化算法(四)NSGA3的代码(MATLAB)
RNN-LSTM卷积神经网络Matlab实现
SSM外文文献和翻译(毕设论文精品).doc
现代操作系统原理与实现.pdf
多机器人编队及避障仿真算法.zip
基于matlab扩频通信系统仿真(整套代码)
非线性本构关系在ABAQUS中的实现.pdf
科研伦理与学术规范 期末考试2 (40题).pdf
芯片验证漫游指南以及源代码.zip
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
最新下载
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
STM32G4 参考手册 中文版
ACIS CAD开发类库
ACIS--CAD开发类库
ACIS--CAD开发类库7
ACIS--CAD开发类库4
ACIS--CAD开发类库6
ACIS--CAD开发类库3
ACIS CAD开发类库2
ACIS CAD开发类库8
其他资源
40个有创意的html+css网页源代码
智能车控制决策系统开发-智行者
大师级的 Axure网站模板,包括后台和APP
常用axure原型库素材
航空售票系统 java web
路径损失估测模型
《编译原理》课程设计指导书 算术表达式的语法分析及语义分析程序设计。
何凯明暗原色先验原理的单一图像去雾技术附PPT及源码
数字图像处理 谢凤英 代码
c51v954a完整版
如何用CruiseControl.Net来进行持续化集成
奔赴无人之境:Apollo GO 2020运营报告-Apollo GO.pdf
途虎养车轮毂数据DEMO
PPT述职模板风格简单明快
第3课 攀登宝塔-2021.01.24.pdf
SQL毕业设计开题报告和外文翻译
流形学习算法matlab
红外对管使用说明及常用典型电路
信号与系统,精华总结
pdksh-5.2.14的rpm包
已知一个只包含 0 和 1 的二进制数,长度不大于 10 ,将其转换为十进制并输出。
matlab Allan方差分析文件
图表细说电子技师速成手册高清pdf版
改进的中值滤波算法