只为小站
首页
域名查询
文件下载
登录
论文研究 -
连续时间马尔可夫决策过程
的方差优化
本文考虑了
连续时间马尔可夫决策过程
中平均报酬的方差优化问题。 假设状态空间是可计数的,而动作空间是Borel可测量的空间。 本文的主要目的是在确定性平稳策略空间中找到方差最小的策略。 与传统的马尔可夫决策过程不同,方差准则中的成本函数将受到未来行动的影响。 为此,我们通过引入称为伪方差的概念将方差最小化问题转换为标准(MDP)。 通过给出伪方差优化问题的策略迭代算法,推导了原始方差优化问题的最优策略,并给出了方差最优策略的充分条件。 最后,我们用一个例子来说明本文的结论。
2024-01-10 23:19:32
398KB
连续时间马尔可夫决策过程
策略迭代
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2019综合测评仿真.zip
SSM外文文献和翻译(毕设论文精品).doc
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
IEEE 39节点系统的Simulink模型
2020年数学建模B题(国二)论文.pdf
基于LSTM模型的股票预测模型_python
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
CNN卷积神经网络Matlab实现
多目标优化算法(四)NSGA3的代码(python3.6)
随机森林用于分类matlab代码
离散时间信号处理第三版课后习题答案
云视通端口扫描器.rar
sqlite运行所需Vc++运行环境,纯净版System.Data.SQLite.dll及SQLite.Interop.dll
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
基于matlab的车牌识别系统设计
最新下载
微信收款PC监控最新源码以及模块.rar
YT8511_reference_design_v1.1_20191018.pdf
flink-connector-jdbc_2.12-1.14.3.jar
暴力破解工具 hydra-8.1-windows.zip
代码考虑电解槽变载启停特性与阶梯式碳交易机制的综合能源系统优化调度matlab-yalmip-cplex/gurob
谷歌官方Tesseract中文语言包 (chi_sim.traineddata)
JESD79-4 DDR4 SDRAM标准.pdf
MATLAB and Simulink In-Depth
DDR5最新协议手册JESD79-5 .7z
03 ModbusTCPServer实验.zip
其他资源
CEEMDAN算法,EEMD和EMD的进一步改进算法
步进频信号一维像仿真Matlab
RF MICROELECTRONICS Second Edition
gephi教程.pdf(中文版)
matlab求最小矩形
matpower cpf
《主流VIO技术综述及VINS解析》PPT以及VINS,ICE_BA,ROVIO论文、代码解析.rar
武汉市行政区划图
基于Skinsharp的MFC界面美化(破解版含几十套皮肤)
MATLAB及经济建模课件(含代码)
Csharp学生管理系统
基于树莓派+Arduino的视觉导航设计
从内存加载DLL完整代码及示例
音频红外发射与接收装置
DATA SHEET_OTC3101A-005A-HF141_V01_FOXLINK.pdf
leetcode-常见考题4.pdf
WS 375-2012疾病控制基本数据集 第2部分:血吸虫病病人管理.pdf
2019年全球工程前沿.pdf
Nacos配置中心.7z
对象数据类型判断.js
CCNP综合实验大全
Floyd算法 Floyd算法
js画图 webvisio-js2.5
视频放大程序
nbtscan.rar
一个销售管理系统适用的Delphi界面源代码..rar
s7-300读取时间 程序