MDP-DP-RL 该项目的目标是从头开始开发所有动态编程和强化学习算法(即,除了基本的numpy和scipy工具之外,不使用标准库)。 “从头开始开发”目标是出于教育目的-学习此主题的学生只有在他们开发和使用从头开始开发的代码时才能彻底理解这些概念。 我针对不同的学生背景讲授了该主题的课程,每门此类课程都以技巧/算法的精确编程实现为基础。 特别是,当我教Stanford CME 241:金融中的随机控制问题的强化学习( )时,会使用此代码库。 关于代码可读性,性能和错误的任何反馈将不胜感激,因为代码仍相当原始且未经各个部分的测试(2018年8月开始使用此代码,到目前为止主要处于代码增长模式)。 该项目开始于为有限的马尔可夫过程(又名马尔可夫链),马尔可夫奖励过程(MRP)和马尔可夫决策过程(MDP)实现基础数据结构。 其次是动态编程(DP)算法,其重点是在代码内以清晰的数学术语表
2021-10-04 12:17:47 148KB Python
1
下面计算遍历的m阶马尔可夫信源的熵率。 当时间足够长后,遍历的马尔可夫信源可以视作平稳信源来处理,又 因为m阶马尔可夫信源发出的符号只与最近的m个符号有关,所以极限 熵 等于条件熵 。 对于齐次遍历的马尔可夫链,其状态 由 唯一确定,因此有 所以
2021-10-03 23:16:37 1.73MB 信息论
1
不好意思,本不想要分的。是马尔可夫随机场的程序,大家可以学习一下
2021-10-03 19:51:21 19KB 马尔可夫随机场
1
mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用
2021-10-03 19:50:32 240KB matlab
1
aspx大马,密码 gksec aspx大马,密码 gksec
2021-10-02 19:55:00 71KB aspx大马
1
aspdama
2021-10-02 18:43:51 71KB asp shell
1
自用asp大马(加密免杀版)
2021-10-02 18:19:45 65KB asp大马 免杀
1
草泥马辅助最新源码,一次下载永久受用。 如有疑问请联系本作者,QQ在源码里
2021-10-02 02:57:10 7.54MB 草泥马辅助
1
马哥(马永亮)带你3天玩转Docker容器实战 2019高薪必备技能-docker容器企业级实战,零基础3天玩转docker-本周限时特价大回馈
2021-10-01 15:21:58 149B 马哥dock
1
马老师jvm实战调优课堂笔记,需要的小伙伴赶紧下载
2021-09-30 15:43:28 3.07MB jvm
1