只为小站
首页
域名查询
文件下载
登录
基于间隙的强化学习无监督探索_Gap-Dependent Unsupervised Exploration for
Reinfo
基于间隙的强化学习无监督探索_Gap-Dependent Unsupervised Exploration for
Reinfo
rcement Learning.pdf
2022-01-30 09:03:52
821KB
cs
Introduction to Multi-Armed Bandits
这本书是非常新(2017年)的 Multi-Armed Bandit 的学习资料,作者是Aleksandrs Slivkins, MSR 的研究员。多臂赌博机在强化学习和在线学习中有很多的应用。
2021-05-03 18:02:31
781KB
MAB
Reinfo
1
Reinfo
rcement Learning: An Introduction 2nd solutions (第二版 答案)
sutton的强化学习第二版的答案,不确定是否为sutton亲自提供的,仅供参考,还是很有帮助的
2019-12-21 20:04:59
2.27MB
Reinfo
sutton
第二版
答案
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2022学术英语写作(东南大学) 章节测试+期末test答案
Spring相关的外文文献和翻译(含出处).zip
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
中小型企业网络建设.pkt
PLECS中文手册.pdf
简易示波器-精英板.zip
多机器人编队及避障仿真算法.zip
基于VMD算法的信号降噪.rar
IEEE 39节点系统的Simulink模型
opcua服务器模拟器+opcua客户端工具.rar
基于STM32的电子时钟设计
上帝之眼和拾荒者.rar
多目标微粒子群算法MOPSO MATLAB代码
基于Matlab的PI/4 DQPSK的调制解调源代吗
SSM外文文献和翻译(毕设论文精品).doc
最新下载
cisco思科GNS3路由镜像文件c3660-jk9o3s-mz.124-15.T14.bin
三峡大学教务处自动抢课软件
Computer Vision--Algorithm and Application (英文原版彩色)
OpenHowNet:HowNet和OpenHowNet Python API的核心数据-源码
VMware MS-DOS7.1 虚拟机
大众汽车 5053 vcds11.11.2 破解版 36MB
dra decoder 1.01
密码学引论(张焕国) 第三版
jacob-1.14.3-x64
全国25万多个地质灾害点空间分布数据,包括崩塌、塌陷、泥石流、地面沉降、地裂缝、滑坡、斜坡7大类地质灾害点。数据分为全国30个省市自治区,数据格式为excel
其他资源
SMPTE 2081 2082 12G-SDI
搜狗中文文本分析语料库
心电信号检测C语言编写的程序
SIFT特征匹配 MATLAB 实现
未来教育考试系统V4.0.exe
批量导入域用户工具
c语言实验贪吃蛇游戏大作业(附源代码和实验报告)
河北工业大学数据库实验
数字信号处理C语言各种算法实现
基于遗传算法的排课系统实现
CV&DL笔记手稿.pdf
51单片机LCD1602
java2D Java Java Java
Java资源管理器(MyExplorer)源码
opengl实现的飞机
简易博客开发
北邮-物联网安全资料
Track-association-JPDA
编辑距离算法,比较字符串相似度
Cplex 学术版下载指南
昂达G31 BIOS
Android资源评论工具类
USB3.0 Layout 指南
侦听任意UDP端口来的数据包然后转发的程序源码
wish等外贸平台SKU及简标题批量小工具
otp_win64_20.2.exe