只为小站
首页
域名查询
文件下载
登录
论文研究 -
连续时间马尔可夫决策过程
的方差优化
本文考虑了
连续时间马尔可夫决策过程
中平均报酬的方差优化问题。 假设状态空间是可计数的,而动作空间是Borel可测量的空间。 本文的主要目的是在确定性平稳策略空间中找到方差最小的策略。 与传统的马尔可夫决策过程不同,方差准则中的成本函数将受到未来行动的影响。 为此,我们通过引入称为伪方差的概念将方差最小化问题转换为标准(MDP)。 通过给出伪方差优化问题的策略迭代算法,推导了原始方差优化问题的最优策略,并给出了方差最优策略的充分条件。 最后,我们用一个例子来说明本文的结论。
2024-01-10 23:19:32
398KB
连续时间马尔可夫决策过程
策略迭代
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
鲸鱼优化算法 WOA matlab源代码(详细注释)
基于FPGA的DDS信号发生器设计(频率、幅度、波形可调)
MATLAB车牌识别系统
多目标优化算法(四)NSGA3的代码(python3.6)
Autojs 例子 源码 1600多个教程源码
夏天IC助手1.8你们懂的
2019综合测评仿真.zip
全国道路网SHP数据.zip
BP_PID控制仿真.rar
知网情感词典(HOWNET)
scratch版 我的世界.sb2
2019年秋招—华为硬件工程师笔试题目.pdf
Android小项目——新闻APP(源码)
Vivado license 永久
新型冠状病毒疫情_2020年东三省数学建模A题_论文展示
最新下载
git Linux安装包
PPT插件(Nordri、iSlide、OneKey、Pocket A、ThreeD、美化大师、OKPlus、洋插件等).rar
华为服务器主板网卡等芯片组驱动for Win2012r2.
分数阶工具箱.rar
玄奥系列软件注册机电脑版,手机版
Vivado暗黑主题配置文件
5G NR_ Architecture, Technology - 5G NR, Architecture, Technology.zip
Altium designer 2019年最新封装库(5/6)
Altium designer 2019年最新封装库(4/6)
Altium designer 2019年最新封装库(3/6)
其他资源
上位机数据采集、储存、实时显示
Python+OpenCv实现车牌检测与识别
HFSS螺旋天线设计
CMU卡内基梅隆大学机器人规划与决策课程课件
腔体滤波器设计
room_scan1.pcd和room_scan2.pcd.rar
静态网页照片墙制作
EOBD诊断开发板代码stm32 obd协议
omniGraffle模板—3d Flowchart
常用轻触开关_拨码开关_自锁开关_微动开关尺寸图
路口摄像头拍摄交通视频avi
习性-源码
java+web电子商务管理系统源码整理
Mysql数据库及可视化工具
长春路网新.dwg
stackedit-5.14.0.zip
Linux基础.emmx
机动车强制报废标准规定.docx
hadoop数据加解密
arduino必备开发设计原理图
php企业网站源码
iOS相机摄像头的调用
javaweb电影购票系统完整源码
BT下载器源码
MathScript编程指南
管家婆工贸版ERPT9Top v18.0免狗破解版