只为小站
首页
域名查询
文件下载
登录
求解部分可观测马氏决策过程的强化学习算法
针对部分可观测马氏决策过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
2021-06-25 14:28:18
339KB
强化学习 部分可观测M
arkov
决策过程 Sarsa
学习 无记忆策略
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Keil5安装包
IEEE33节点配电网Simulink模型.rar
中国地面气象站观测数据2000-2021
BP_PID控制仿真.rar
2020年数学建模B题(国二)论文.pdf
transformer_pytorch_inCV.rar
Matpower中文使用手册(原名《MATPOWER手册(中文版)》).rar
基于Servlet+jsp+mysql开发javaWeb学生成绩管理系统
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
人体姿态检测
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
西安问题电缆-工程伦理案例分析.zip
MPC 模型预测控制matlab仿真程序
MATLAB之LSTM预测
基于matlab的车牌识别系统设计
最新下载
核电子技术原理--王芝英
小型车站引导广播中综合系统(一)
锂电池管理系统合集-V2.35-3天邦达铁塔换电BMS&通用上位机 V1.55和采集线接法
ActiveTcl 8.4 - 8.6
XDS560PLUS驱动
H+ V4.9 后台主题UI框架 官方原版代码+完整文档
Trae 海外版-国际版 下载
ISO14229 + ISO15765 全套中文+英文版.rar
PIEOrtho(遥感影像处理软件)v4.20官方安装版(附安装使用教程)
极域电子教室管理系统软件V2.0 2022稳定版 支持Win11
其他资源
最简单的flash动画
VB.NET学生成绩管理系统
研华 数据采集卡应用与编程
Clover Configurator中文版
51单片机光电编码器测速
自适应滤波器matlab代码
差分隐私机器学习理论算法与应用PPT
2015电赛 风力摆控制系统赛题解析及源代码开源
用VC(MFC)编写的学生信息管理系统源代码
用于提取感兴趣区域提取的GBVS算法原理,
抢单系统京东淘宝自动抢单区块源码.zip
vc模拟按键盘_VK_NUMLOCK.zip
easygui-0.97.zip
一个完整的ajax应用例子
北大青鸟影院
最新精仿砍柴网自媒体新闻资讯网站源码_织梦DEDE内核 数据 手机WAP版.zip
ssh网上拍卖系统
MicrosoftWebDriver
背景差分法检测
MATLAB及其在FPGA中的应用(第二版)
Big.Java.Binder.Ready.Version.Early.Objects.6th.Edition.1119056446