只为小站
首页
域名查询
文件下载
登录
论文研究 -
连续时间马尔可夫决策过程
的方差优化
本文考虑了
连续时间马尔可夫决策过程
中平均报酬的方差优化问题。 假设状态空间是可计数的,而动作空间是Borel可测量的空间。 本文的主要目的是在确定性平稳策略空间中找到方差最小的策略。 与传统的马尔可夫决策过程不同,方差准则中的成本函数将受到未来行动的影响。 为此,我们通过引入称为伪方差的概念将方差最小化问题转换为标准(MDP)。 通过给出伪方差优化问题的策略迭代算法,推导了原始方差优化问题的最优策略,并给出了方差最优策略的充分条件。 最后,我们用一个例子来说明本文的结论。
2024-01-10 23:19:32
398KB
连续时间马尔可夫决策过程
策略迭代
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
IEEE33节点配电网Simulink模型.rar
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
麻雀搜索算法(SSA)优化bp网络
Landsat 8地表温度反演免费软件(北京大学遥感所任华忠研究员团队)
基于yolov4-keras的抽烟检测(源码+数据集)
ChinaMeteorologicalDataHandler.R
matpower5.0b1.zip
2019和2021年华为单板通用硬件笔试题及答案
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
基于VMD算法的信号降噪.rar
基于Servlet+jsp+mysql开发javaWeb学生成绩管理系统
基于MQ2烟雾传感器的STM32F103程序
MVDR,Capon波束形成DO估计.zip
随机森林用于分类matlab代码
MTALAB NSGA2算法
最新下载
行政事业单位公文软件破解版
timescaledb-postgresql-12_1.7.1-windows-amd64.zip
宝塔第三方插件 百度网盘 v3.4 一键备份数据到百度网盘
贝叶斯网络可视化软件GeNIe使用说明
Labview 2017 安装包管理器,Labview windows运行引擎
高等应用数学问题的MATLAB求解_第三版_薛定宇
基于Android仿QQ聊天系统毕业设计论文(含源码)
flash Tools_DUMLdore-master.zip
gcc-4.4.4-glibc-2.11.1-multilib-1.0_EasyARM-iMX283.tar.bz2
FPGA读写AM29LV320DB
其他资源
qtwinmigrate for qt5
ESP8266的TCP服务器连接错误解决办法
7z密码破解文件
GH_Bladed-4.8-Theory Manual
C++文件传输系统的实现
树叶图像特征分类识别MATLAB程序
LordPE V1.4
基于单片机的蓝牙计步器的设计
基于matlab的Tsai标定算法
矩阵理论在计算机视觉专业方面的应用
opencv_imgproc249d.dll
Bmp280气压传感器.zip
Mysql5.7安装配置.md
通达信GDR.tn6
FPGA语音通信平台设计实例.7z
cygwin1.75.part09.rar 完全版(总1.6G)
巧用3dmax快捷键,提高作图效率
palm 手掌检测的训练文件
腾讯产品策划运营类职位笔试题和参考答案
NS2 nist wimax patch
安装iverlog和gtkwave
DaVinci Resolve 15权威指南 完整版
DevView查看内核设备对象的工具
BBS论坛源码
C# Excel导入导出