只为小站
首页
域名查询
文件下载
登录
强化学习入门必读书籍
本资源适用于强化学习的入门使用,比较适合学生,原理讲解的比较清晰
2021-10-28 10:18:03
27.23MB
Qlearn
1
Qlearn
ing的PPT
Qlearn
ing的PPT讲义,包括举例子以及公式推导。
QLearn
ing是强化学习算法中value-based的算法,Q即为Q(s,a)就是在某一时刻的 s 状态下(s∈S),采取 动作a (a∈A)动作能够获得收益的期望,环境会根据agent的动作反馈相应的回报reward r,所以算法的主要思想就是将State与Action构建成一张Q-table来存储Q值,然后根据Q值来选取能够获得最大的收益的动作。
2021-10-21 19:50:30
30.5MB
Qlearn
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Plex v7.12电视端app
故障诊断数据集及实现代码
云视通端口扫描器.rar
android开发期末大作业.zip
C4.5决策树算法的Python代码和数据样本
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
Vivado永久激活license(亲测可用)包(搜集的全部可用LICENSE)
股票价格预测-LSTM-TCN-GBDT:使用四种算法(LSTM,TCN,GRU,GBDT)进行股票价格的预测和预测结果的检验。有四种算法(LSTM,TCN,GRU,GBDT)用于预测股价并检验预测结果-源码
基于Python网络爬虫毕业论文.doc
Python+OpenCV实现行人检测(含配置说明)
基于matlab扩频通信系统仿真(整套代码)
python实现的学生信息管理系统—GUI界面版
ChinaMeteorologicalDataHandler.R
elsevier 爱思唯尔 系列期刊的word模板,template,单栏,双栏
sqlite运行所需Vc++运行环境,纯净版System.Data.SQLite.dll及SQLite.Interop.dll
最新下载
Delphi.High.Performance.Applications.Concurrency--中文版.pdf
【解包工具】asmodean tools合集(含源码)
百度翻译API源码
朱雪龙《应用信息论基础》(清晰版教材)
华为AP6050DN Fat&CloudAP6050DN-V200R019C00SPC912固件
ADS1292R开发板资料
arm-linux-gcc-4.5.1-v6-vfp-20101103.gz
Tajima绣花机的DST文件编码规则简介
kettle_jdbc_连接mysql_oracle_dm_gbase数据库jar包.rar
Abaqus模拟焊接的方法
其他资源
惯性导航pdf
NI-GPIB-usb 光盘
STCs 编码讲解-关晴骁
六普人口数据(具体到街道)
HR人事管理系统 spring mvc + spring + hibernate + bootstrap + mysql.zip
处理机调度算法实现(文档+代码)
labview56个小程序
Any CAD 2D/3D图形平台帮助文档(C#版)
C#开发网络摄像机预览视频,云台控制
C#制作的小游戏
winform多语言,vb.net,vb.net多语言程序,多语言切换,.net多语言实现
SSM框架echarts图表显示
note:笔记-源码
advent2020-源码
高等测量平差例题.pptx
md转Html案例代码(Markdown.Converter)
简易版 TYPE-C 封装
学生宿舍管理管理系统
计算机图形学 visual c++ 6.0 三维变换(有注释) .zip
hog+svm行人检测分类器训练
视频放大程序
NS2手册(包括英文版和精美中文版还有ns2学习笔记)
中文液晶消费机软件ACC(V7.52)
录音程序(带有端点检测的语音录音程序)
工程师用的边界元法,适合搞工程的人学习