只为小站
首页
域名查询
文件下载
登录
强化学习入门必读书籍
本资源适用于强化学习的入门使用,比较适合学生,原理讲解的比较清晰
2021-10-28 10:18:03
27.23MB
Qlearn
1
Qlearn
ing的PPT
Qlearn
ing的PPT讲义,包括举例子以及公式推导。
QLearn
ing是强化学习算法中value-based的算法,Q即为Q(s,a)就是在某一时刻的 s 状态下(s∈S),采取 动作a (a∈A)动作能够获得收益的期望,环境会根据agent的动作反馈相应的回报reward r,所以算法的主要思想就是将State与Action构建成一张Q-table来存储Q值,然后根据Q值来选取能够获得最大的收益的动作。
2021-10-21 19:50:30
30.5MB
Qlearn
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
随机森林用于分类matlab代码
PSO-LSSVM的MATLAB代码.rar
校园网规划与设计和pkt文件
Spring相关的外文文献和翻译(含出处).zip
token登录器.rar
voc车辆检测数据集(已处理好,可直接训练)
Elsevier爱思唯尔的word模板.zip
RentingSystem.rar
夏天IC助手1.8你们懂的
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
android studio课程设计作业PPT+设计文档+可运行源代码+设计思路
基于matlab扩频通信系统仿真(整套代码)
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
2020年数学建模国赛C题论文
最新下载
武汉大学-朱卫平-商务智能-作业1.zip
爬取微信小程序源码工具
Turbo与LDPC编解码及其应用-肖扬
WCDMA SIB消息
IEEE的论文模板
速达全系列通用免狗补丁完美终结版
otp_win64_23.2.zip
用友时空密码查看器
佳佳象棋冠军版,王中王开局库
中华象棋王商业库.zip
其他资源
轴系CAD.dwg文件
Demo:ArcEngine简单教程——数据属性:属性表、识别(Identify);删除图层 等功能实现
MODTRAN使用PPT(北师大版)
新编MCS-51单片机应用设计(清晰最新版)
基于种子点8-邻域的区间生长算法的Matlab实现
电子电路分析与设计(第三版)答案
openGL3D模型贴图
宠物自动喂食器
html精美的表格样式
汽车二自由度状态方程模型
基于FPGA的串口通信程序(Verilog带FIFO testbench)
Robo Pro 软件下载
2014年厦门大学《概率论与数理统计》期中考试试卷(含答案).pdf
投票React-源码
最新PHP笔试试题.pdf
Android Studio的Flutter插件
lindo 6.1 绿色免安装 运筹学软件
discuz微信登录插件
全国大学生电子设计竞赛培训系列教程 数字系统与自动控制系统设计
Delphi10.3 中通过JNI调用 Java 函数
JSP机票网上销售系统
java同学录
gaussian09安装