只为小站
首页
域名查询
文件下载
登录
求解部分可观测马氏决策过程的强化学习算法
针对部分可观测马氏决策过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
2021-06-25 14:28:18
339KB
强化学习 部分可观测M
arkov
决策过程 Sarsa
学习 无记忆策略
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
avantage 软件 xps 处理软件30天后不能使用问题
token登录器.rar
MATLAB之LSTM预测
transformer_pytorch_inCV.rar
华为结构与材料工程师-知识点总结【by詹姆斯申易登】.pdf
Academic+Phrasebank+2021+Edition+_中英文对照.pdf
东南大学英语技术写作慕课所有答案
基于STM32的FFT频谱分析+波形识别
Android小项目——新闻APP(源码)
2019和2021年华为单板通用硬件笔试题及答案
2019年秋招—华为硬件工程师笔试题目.pdf
YOLOv5 人脸口罩图片数据集
上帝之眼和拾荒者.rar
Python+OpenCV实现行人检测(含配置说明)
最新下载
c源程序_fluentudf_热流udf_UDF温度_
CST仿真设计理论与实践-彩pdf完整电子版+案例详解+工程应用张晓主编
Android API中文文档.rar
MATLAB智能算法-温正-配书代码
H3C-iNode-PC-7.3-E0630 inode最新全平台客户端 支持Windows和Mac和linux等
Python基于Django图书管理系统源代码
pcm音频文件
ArcGISProAI助手插件2.1(接入Deepseek)
otp_win64_19.3稳定版
AR1220-V200R005C20SPC200.zip
其他资源
高波特率串口调试助手
水果识别系统源代码
jdk1.7 64位官方下载
Astar 算法的Matlab实现
Java,mysql的超市管理系统大作业
图像处理(图像去噪并绘制直方图).rar
三维重建算法 MATLAB 点云数据
win32_11gR2_client.zip
Seam Carving for Content-Aware Image Resizing(基于内容缩放图片的方法)
三维瓦片数据(3d-tiles)
STMicroelectronics flash loader
JAVA扑克牌发牌程序.txt
自行车三维模型sw
C#网络对战五子棋(c/s)源程序
Java版数据结构与算法视频教程(20集版),【附源码资料-赠送java学习资料汇总】.txt
install.zip
谷歌浏览器75版本64位离线安装包
WINDOWS核心编程_笔记合集.zip
剩余型直觉模糊推理的三Ⅰ方法
videoSdk.zip
git-commit-emoji-cn::beaming_face_with_smiling_eyes:git提交消息emoji使用指南-源码
MATLAB操作手册-桌面工具和开发环境 (R2020a)
HttpClient.jar codec.jar logging.jar