只为小站
首页
域名查询
文件下载
登录
首页
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
上传者:
38723516
|
上传时间: 2022-07-29 00:17:17
|
文件大小: 3KB
|
文件类型: ZIP
matlab
Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发","children":[{"title":"qlearning.zip <span style='color:#111;'> 2.62KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
微信小程序开发ppt详解
abaqus手册线性粘弹性UMAT详细解读
张正友相机标定算法c++实现
toad_for_oracle_12.8 中文版破解版带注册码
一维离散余弦变换矩阵生成
图书管理系统(Java)+优秀毕业设计论文+源码
The Fourier Transform and Its Applications
Real 802.11 Security - Wi-Fi Protected Access and 802.11i
苏大872真题.rar
最新运营版AI智能机器人云矿机合约区块链网站源码团队树自动收益对接免签支付.zip
visual c++ vc socket tcp实现http协议
抖音去水印
OPC UA DLLS
EMD matlab代码
google-chrome-stable-27.0.1453.110-202711.x86_64.rpm
Android应用源码之流量监控
java-loadresource.rar
LMS算法仿真
变压器原理图封装
《php+MySql开发实例教程》源码
XmlSpy 真正汉化破解版
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
热门下载
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
先进PID控制Matlab仿真第4版-PDF+代码.zip
中国地面气候资料日值数据集(V3.0)2014-2019.zip
上帝之眼和拾荒者.rar
计算机专业实习日记+实习周记+实习总结
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
雷达信号处理仿真程序(MTI,MTD等)
股票价格预测-LSTM-TCN-GBDT:使用四种算法(LSTM,TCN,GRU,GBDT)进行股票价格的预测和预测结果的检验。有四种算法(LSTM,TCN,GRU,GBDT)用于预测股价并检验预测结果-源码
现代操作系统原理与实现.pdf
基于LSTM模型的股票预测模型_python
韦来生《数理统计》课后习题与答案
全国道路网SHP数据.zip
张正友相机标定Opencv实现(完整程序+棋盘图)实例源码
python实现的学生信息管理系统—GUI界面版
JPEG的Matlab实现
最新下载
Cortex-M3 反汇编器
Npcgen_zx v3.3
HP增霸卡使用指南.pdf
kbq_drv_AD7606_非设备树传统方式驱动,目前使用最快25k采样率.rar
arcgis景观空间格局分析插件Patch Analyst (10.X)斑块分析师
统计与自适应信号处理课后习题答案.pdf
8650平板电脑万能刷机包。2
动森amiibo.zip
磐石系列加密狗型号检测
OgreSE场景编辑器