只为小站
首页
域名查询
文件下载
登录
首页
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
上传者:
38723516
|
上传时间: 2022-07-29 00:17:17
|
文件大小: 3KB
|
文件类型: ZIP
matlab
Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发","children":[{"title":"qlearning.zip <span style='color:#111;'> 2.62KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
理论力学第五版课后答案
MTALAB NSGA2算法
CTA8280测试系统说明书
mlx90614红外测温传感器stm32f103rct6
OV5640_Nexys_Video_CSDN.7z
信息论基础 (陈前斌 蒋青 于秀兰 着) 高等教育出版社 课后答案
OMNIC_中文用户指南
C#调用航天金税key接口开票、作废、冲红发票
python networkX包最新参考文档
opengl编写的五子棋
电子专利申请环境VMware10镜像XP-CPC 4/4
银行排队系统模拟c++
聚类分析OPTICS算法python实现
HashMap源码(JDK1.7,含注释)
3.96KB的文件能做啥 2019 全球编程大赛作品:玻璃容器 作者 依奥斯 3.96KB.rar
数字信号处理实验平台.rar
NeHe-OpenGl-Qt5-Lesson01_CreateWindow_islinyoubiao.zip
linux云计算教程之openstack
基于TCP协议的Socket通信-简易聊天室.doc
病人监护系统设计
单相桥式半控整流电路实验
jacob以目录和段落分析读取Word文档(自己写的)
中南大学离散数学PPT
CAA二次开发之3D标注的应用
Modbus源码(PIC单片机版)
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
热门下载
人体姿态检测
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
基于hadoop商品推荐系统课程设计
全国道路网SHP数据.zip
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
Android大作业——网上购物APP(一定是你想要的)
夏天IC助手1.8你们懂的
随机森林用于分类matlab代码
银行笔试 信息科技岗部分真题
Plexim Plecs Standalone 4.1.2 x64.7z
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
android开发期末大作业.zip
JPEG的Matlab实现
EEMD算法应用于信号去噪.rar
基于STM32的电子时钟设计
最新下载
KepserverV4.5连接S71200和S71500PLC(修改版)
LP Wizard 10.5破解版
Word2TeX 注册破解版 Word转Tex软件 doc转tex
Unity 2D水交互插件
全国地图shp
烟感探测器设计全部资料,打包下载,可用
基于MATLAB的带载流子密度双温模型与德鲁德模型仿真:电子晶格温度及飞秒激光源模拟 双温模型
DevPartner Studio Professional Edition 11.4.0
isp lever 中文教程
未来教育二级java激活码