只为小站
首页
域名查询
文件下载
登录
首页
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发
上传者:
38723516
|
上传时间: 2022-07-29 00:17:17
|
文件大小: 3KB
|
文件类型: ZIP
matlab
Q-learning with epsilon-greedy explore Algorithm for Deterministic Cleaning Robot V1 确定性清洁机器人 MDP 清洁机器人必须收集用过的罐子也必须为其充电电池。 状态描述了机器人的位置和动作描述运动的方向。 机器人可以向左移动或向左移动正确的。 第一个 (1) 和最后 (6) 个状态是终端状态。 目标是找到最大化回报的最优策略从任何初始状态。 这里是 Q-learning epsilon-greedy 探索使用算法(在强化学习中)。 算法 2-3,来自: @book{busoniu2010reinforcement, title={使用函数逼近器的强化学习和动态规划}, 作者={Busoniu,Lucian 和 Babuska,Robert 和 De Schutter,Bart 和 Ernst,Damien
文件下载
立即下载
资源详情
[{"title":"( 1 个子文件 3KB ) 确定性清洁机器人的 Q-learning(无模型值迭代)算法:使用 Q-learning 和 epsilon-greedy 探索的强化学习示例-matlab开发","children":[{"title":"qlearning.zip <span style='color:#111;'> 2.62KB </span>","children":null,"spread":false}],"spread":true}]
评论信息
其他资源
modbus 从机官方标准程序
声明一个类Point,然后利用它声明一个组合类Line,实现由用户输入两点确定直线的长度和斜率,编写程序实现测试
基于Linux的网络聊天室的设计与实现
VB-Net自学经典PPT教程(完整版).ppt
PowerDataRecovery+注册码
班级班费管理系统EJB3.0+mysql
TM4C123gmpu6050.rar
NIS-Elements AR快速手册.pdf
阐述手机游戏用户界面设计的8大步骤
Axure学习资料产品经理使用Axure工具经验谈
剑指offer(java版).pdf
模块2Python语言基础.pptx
MerryChristmas.rar
cvos:可启动PDF CV-源码
操作系统思维导图整理.zip
后台开发邮箱转发的jar包+后台测试代码.zip
我所见的功能最强的服装类批发销售管理软件强力推荐版
Linux增加字符设备驱动实验
C#网络爬虫源码(爬取58同城和链接网全国小区信息并保存到数据库)
增益带宽可调放大器
Magento学习资料
nero9.0刻录软件免安装绿色版 完美兼容Win7
免责申明
【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
个人信息
点我去登录
购买积分
下载历史
恢复订单
相关资源标签
热门下载
东南大学英语技术写作慕课所有答案
空间谱估计理论与算法------程序.rar
BP_PID控制仿真.rar
MVDR,Capon波束形成DO估计.zip
elsevier 爱思唯尔 系列期刊的word模板,template,单栏,双栏
拾荒者.exe同时ID扫描器IP扫描器
多目标微粒子群算法MOPSO MATLAB代码
基于hadoop商品推荐系统课程设计
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
多机器人编队及避障仿真算法.zip
ios无人直播 虚拟视频实用版 可以导入视频
2019和2021年华为单板通用硬件笔试题及答案
基于STM32的电子时钟设计
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
Spring相关的外文文献和翻译(含出处).zip
最新下载
电脑BIOS提取工具,版本,型号都可以提取
TMS320F28335_串口_SCI
MITgcmTools.jl:与MITgcm交互的工具(设置,运行,输出,绘图等)-源码
Coefficients of Polynomial Chaos Expansion (PCE):这个简单的 Matlab 代码计算对数正态分布不确定参数 X 的 PCE 系数,最高可达 N 阶。-matlab开发
DicomObjects用户手册-中文版
protobuf 使用简单示例
LOL模型转换工具
电子噪声与低噪声设计
复盛压缩机选型软件.rar )
SKNTOOBJ实用工具