只为小站
首页
域名查询
文件下载
登录
实用
马尔可夫决策
过程 高清版
实用
马尔可夫决策
过程 对于智能规划的学习有很大的帮助
2021-12-15 19:50:34
2.86MB
实用马尔可夫决策过程
刘克著
1
matlab代码移植-service-migration-mdp:论文代码“基于
马尔可夫决策
过程的移动边缘计算中的动态服务迁移”
Matlab代码移植基于
马尔可夫决策
过程的移动边缘计算中的动态服务迁移 这是S. Wang,R. Urgaonkar,M. Zafer,T. He,K. Chan,Leung KK Leung的仿真代码,“基于Markov决策过程的移动边缘计算中的动态服务迁移”,IEEE / ACM。关于网络,第一卷。 27号3,第1272至1288页,2019年6月。(arXiv链接:) 该代码在MATLAB上运行效果最佳。 它也可以继续运行,但是瞬时成本图可能会以较低的粒度显示。 要重现随机游走结果(本文的图6),请运行mainRandomWalk.m 。 要使用实际基站位置来再现结果(本文的图8),请运行mainRealCellLocation.m 。 mainRandomWalk.m和mainRealCellLocation.m中的某些参数可以针对不同的实验进行更改。 主算法中实现algorithms.m被称为内mainRandomWalk.m和mainRealCellLocation.m 。 从获得真实用户跟踪,从获得基站位置。 它们保存在traceRealCellLocations.mat
2021-10-29 17:27:43
968KB
系统开源
1
mdp-maze:Python 中的
马尔可夫决策
过程实现-源码
mdp-迷宫 Python 中的
马尔可夫决策
过程实现。
2021-10-13 19:11:41
124KB
JavaScript
1
lpcmatlab代码-MDPs_Value-Iteration:
马尔可夫决策
过程的值迭代算法
lpc matlab代码 :mountain:
马尔可夫决策
过程的值迭代算法 该存储库的内容作为计算机科学理学硕士课程的学生要求的概率图形模型课程的一项分配项目。 这段代码的版本中提供的所有资源都是从您可以在参考部分找到的类书中获得的。 算法和信息的这种应用仅用于教育目的 描述: 实现值迭代算法以解决离散的
马尔可夫决策
过程。 教授: 博士 参与的学生: 马里奥·德·洛斯·桑托斯(Mario De Los Santos)。 Github :。 电子邮件: 指示 下载存储库的文件 验证C ++版本是否至少为C ++ 14 调用文档中标记的功能 以下算法基于教授提供的文档。 用作参考的书位于此文件的末尾。 值迭代算法包括根据Bellman方程迭代地估计每个状态s的值。 下图显示了用于创建该项目的伪代码。 Policy迭代算法由基于Bellman方程迭代地估算每个状态s的值组成,主要区别在于我们将Policy存储在每次迭代中,这将使我们可以将迭代(t)与(t-1)进行比较),那么如果政策相同,则我们将完成该过程,这将以存储成本为您带来计算速度上的优势。 图像2显示了用于创建该项目的伪代码。 示例需要调用该类,如
2021-10-07 17:56:24
929KB
系统开源
1
MDP-DP-RL:
马尔可夫决策
过程,动态规划和强化学习-源码
MDP-DP-RL 该项目的目标是从头开始开发所有动态编程和强化学习算法(即,除了基本的numpy和scipy工具之外,不使用标准库)。 “从头开始开发”目标是出于教育目的-学习此主题的学生只有在他们开发和使用从头开始开发的代码时才能彻底理解这些概念。 我针对不同的学生背景讲授了该主题的课程,每门此类课程都以技巧/算法的精确编程实现为基础。 特别是,当我教Stanford CME 241:金融中的随机控制问题的强化学习( )时,会使用此代码库。 关于代码可读性,性能和错误的任何反馈将不胜感激,因为代码仍相当原始且未经各个部分的测试(2018年8月开始使用此代码,到目前为止主要处于代码增长模式)。 该项目开始于为有限的马尔可夫过程(又名马尔可夫链),马尔可夫奖励过程(MRP)和
马尔可夫决策
过程(MDP)实现基础数据结构。 其次是动态编程(DP)算法,其重点是在代码内以清晰的数学术语表
2021-10-04 12:17:47
148KB
Python
1
mdp(
马尔可夫决策
过程)2009年matlab源码,非常详细全面,非常实用
mdp(
马尔可夫决策
过程)2009年matlab源码,非常详细全面,非常实用
2021-10-03 19:50:32
240KB
matlab
1
基于
马尔可夫决策
的应急物资动态分配模型
研究供需不平衡环境下的应急物资动态分配问题.考虑到台风灾害演变导致应急物资需求不断增长与应急物资供应相对紧缺之间的矛盾,将需求的演变设计成一个
马尔可夫决策
过程,建立基于
马尔可夫决策
的应急物资动态分配模型.通过二进制粒子群优化算法求解,最后将所提出模型应用于某台风发生时的救灾实例.实例分析表明,
马尔可夫决策
方法可以动态地做出合适的需求扑灭策略,使得整体的需求演变趋势保持平稳,整体的需求水平降到最低.
2021-09-30 11:51:14
318KB
应急物流 物资分配 台风灾害 马尔可夫决策 粒子群算法
1
mdp(
马尔可夫决策
过程)2009年matlab源码,非常详细全面,非常实用
2009年写的matlab mdp源码,里面有全部的英文document介绍说明 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
2021-09-07 14:54:41
225KB
matlab
mdp
源码
实现
1
马尔可夫决策
过程实例讲解.pdf
中文版的MDP详细讲解,包括公式的完整推导过程,内容详细,通俗易懂,是学习MDP和强化学习难得的参考资料。
2021-08-26 16:45:05
1.68MB
马尔科夫决策过程
强化学习
1
POMDP:基于部分可观察的
马尔可夫决策
过程实现RL算法-源码
POMDP:基于部分可观察的
马尔可夫决策
过程实现RL算法
2021-08-18 20:46:53
165KB
reinforcement-learning
matlab
neuroscience
reinforcement-learning-algorithms
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
中国地面气候资料日值数据集(V3.0)2010-2019.rar
上帝之眼和拾荒者.rar
风电场风速及功率数据.zip
Keil5安装包
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
知网情感词典(HOWNET)
数字图像处理[冈萨雷斯]
CNN卷积神经网络Matlab实现
中国地面气候资料日值数据集(V3.0)2014-2019.zip
华为OD机试真题.pdf
CPLEX12.8学术版安装包:cplex_studio128.win-x86-64.exe
RX560 bios合集(请务必注意显存品牌和大小以及是否需要6pin!)含刷新工具.zip
凯斯西储大学(CWRU)轴承数据集(含数据包+整理Python程序+使用说明)
2010年-2020中国地面气候资料数据集(V3.0)
YOLOv5 人脸口罩图片数据集
最新下载
新型单周期控制的无桥Boost PFC变换器 (2014年)
叠像术的matlab实现
CoronaHack -Chest X-Ray-Dataset CoronaHack-胸部X射线数据集-数据集
802.11a——matlab仿真
科学和工程计算基础.pdf
xsteel属性对话框移动小程序
MATLAB AGC示例
计算机数学基础 完整中文版 清晰版 pdf
VM虚拟机安装 S7-1507S 1505S 所需的BIOS文件
山东大学三元闭包实验
其他资源
运动会管理系统 java mysql 完整能运行版
凸分析(史树中)
K210-寄存器手册内部资源
win10 IOS文件,中文版,百度网盘,镜像,免激活
时域同步平均
常用汉字utf-8字符集.txt
arcgis api for js实现距离测量和面积测量的完整代码
人脸图像预处理的matlab源程序
通信系统的完整OFDM代码
kernel.rar
vagrant_2.1.1_x86_64.msi
win8win10软件窗口显示不全问题解决
windows护眼主题
Cities.exe
震旦ADC366_286维修手册.pdf
audion:Audion(网络音频检查器)是一个Chrome扩展程序,可将Web音频面板添加到开发人员工具中。 该面板实时可视化Web音频图,并允许用户检查节点-源码
windows开机动画钢铁侠核反应堆
stm32f103c8t6数据手册
移远EC20 MQTT协议文档 英文
Qt编写的MP3播放器
源程序文件重复率自动检测系统 设计与开发
神舟战神系列风扇调速软件
SkyLine TerraExplorer Pro 6.5 中文补丁
编译原理实验报告 词法分析器实验报告
ralink.bin(hg255d网页刷uboot所需固件)