只为小站
首页
域名查询
文件下载
登录
求解部分可观测
马氏决策
过程的强化学习算法
针对部分可观测
马氏决策
过程(POMDP) 中, 由于感知混淆现象的存在, 利用Sarsa 等算法得到的无记忆策 略可能发生振荡的现象, 研究了一种基于记忆的强化学习算法——CPnSarsa (K) 学习算法来解决该问题. 它通过重新 定义状态,A gent 结合观测历史来识别混淆状态. 将CPnSarsa (K) 算法应用到一些典型的POMDP, 最后得到的是最 优或近似最优策略. 与以往算法相比, 该算法的收敛速度有了很大提高.
2021-06-25 14:28:18
339KB
强化学习 部分可观测M
arkov
决策过程 Sarsa
学习 无记忆策略
1
马尔可夫决策过程引论
马氏决策
的好书,可用于Internet流量分析建模,无线网络资源分配建模
2019-12-21 19:35:18
6.05MB
马氏决策
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
全国道路网SHP数据.zip
DBSCAN算法Matlab实现
多智能体的编队控制程序的补充(之前上传少了一个文件)
python实现的学生信息管理系统—GUI界面版
基于Matlab的IEEE14节点潮流计算.zip
Vivado license 永久
基于VMD算法的信号降噪.rar
2021华为芯片研发岗位笔试题
Android小项目——新闻APP(源码)
stm32f103+OLED12864+FFT音乐频谱(多种显示效果 提供原理图)
C4.5决策树算法的Python代码和数据样本
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
MATLAB车牌识别系统
安卓开发期末大作业----单词本(源码,任务书,大报告,apk文件)(基于andord studio)
超大规模集成电路先进光刻理论与应用.pdf
最新下载
HP ProLiant DL388p Gen8驱动 下载
RATA Raster (BMP) To Allegro (IPF)软件工具
小游戏微信排行榜子域相关
信息学奥赛培训整套教案
excle数据可视化图表模板.rar
网络与信息安全课件
ns-keylogger.apk
AXURE手机组件库
广东工业大学图形学实验(opengl)
MinGW 3.2.0
其他资源
多径多普勒信道的matlab简单仿真
电动汽车电池充放电simulink仿真模型matlab.zip
33遗传算法
SQLCipher 2.2.1 解密数据库 Windows使用
Writing An Interpreter In Go图书,代码(mobi,pdf,epub)
基于matlab车流量统计
牛顿—拉夫逊法潮流很详细编程步骤matlab
基于stc89c51单片机的红外报警系统设计
QT 软键盘_支持中文
卫星导航定位与原理课件
revman5.3.zip
STM32F091 IAP示例工程
矩阵位移法_MATLAB程序
用MATLAB的GUIDE工具做有GUI界面的串口通信上位机
DSP28335中文手册
RFC6749中文版本(OAuth2.0协议中文版本)
自定义拍照、录制视频工具类.zip
美国大学生建模2019-C题.rar
餐饮管理系统.zip
51单片机-数码管时钟秒表
hmc5883l 与51单片机接线图
IT运维服务年度报告
VB+SQL数据库系统开发实例(超市,酒店,销售,图书管理,汽车销售,学生宿舍管理等十几种系统)
apriori 频繁项集与关联规则 算法的matlab实现