只为小站
首页
域名查询
文件下载
登录
深度
强化学习源码
python
源码基于numpy和pytorch,包含各类传统的强化学习算法,可以用于入门学习和非专业领域快速应用。
2022-10-07 21:05:40
235.2MB
强化学习
深度学习
入门
1
gkp-rl:使用GKP代码进行量子错误校正的强化学习-源码
gkp-rl 使用GKP代码进行量子错误校正的强化学习。
2022-03-11 09:02:20
1.38MB
JupyterNotebook
1
qtrader:资产组合管理的强化学习-源码
qtrader 资产组合管理的强化学习 为什么要进行强化学习? 学习最佳行动,而不是为市场建模。 由于其在线培训,因此可以适应市场的暂时变化。 优化长期(累积)回报,而不是瞬时收益。 设置 由于typing s,因此与Python 3兼容 苹果系统 source scripts/setup.sh 文献资料 : qtrader简介 :现有方法的动机,利弊 :相关资源清单 :硕士论文 :15分钟的项目演讲
2022-03-03 00:26:30
18.03MB
python
reinforcement-learning
q-learning
recurrent-neural-networks
1
从头开始训练机器人手臂:构建环境并从头开始训练机器人手臂(强化学习)-源码
从头开始训练机器人手臂 :建立培训框架 :学习从头开始构建环境 :完成基本的环境脚本,看看手臂如何运动 :插入强化学习方法并尝试对其进行培训 :优化和调试 :制定目标 依存关系 Python 张量流 g 麻木 此强化学习练习代码的中文教程为 。 您可以在上查看更多教程,或在了解有关我的更多信息。
2022-01-19 16:05:24
59KB
python
machine-learning
tutorial
reinforcement-learning
1
FCMADDPG_编队控制学习_MADDPG_编队控制_编队_深度强化学习_源码
基于深度强化学习的编队控制使用MADDPG算法
2022-01-18 14:59:03
11KB
编队控制学习
MADDPG
编队控制
编队
1
多主体强化学习-源码
Udacity深度强化学习纳米学位-项目3:合作与竞争 介绍 对于这个Udacity项目,我使用了一个DDPG代理来解决多代理协作环境。 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或越界将球击中,则其收益为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 该任务是情节性的,并且为了解决环境,您的特工必须获得+0.5的平均分数(在两个特工均取得最大分值之后,连续100次以上)。 具体来说, 在每个情节之后,我们将汇总每个代理商的奖励(不打折),以获得每个代理商的得分。 这将产生2个(可能不同)的分数。 然后,我们取这两个分数中的最大值。 这为每
2022-01-13 16:41:31
1.06MB
JupyterNotebook
1
simglucose:用Python实现的Type-1糖尿病模拟器,用于强化学习-源码
单糖 用Python实现的Type-1糖尿病模拟器,用于强化学习 该模拟器是FDA批准的的python实现,仅用于研究目的。 该模拟器包括30名虚拟患者,10名青少年,10名成人,10名儿童。 引用方式:谢金玉。 Simglucose v0.2.1(2018)[在线]。 可用: : 。 访问日期:年月日。 注意:simglucose仅支持python3。 动画片 CVGA绘图 BG跟踪图 风险指数统计 主要特点 仿真环境遵循和 API。 它在每个步骤都返回观察,奖励,完成,信息,这意味着模拟器已“加强学习”。 支持定制的奖励功能。 奖励功能是最近一小时血糖测量值的功能。 默认情况下,每个步骤的回报是risk[t-1] - risk[t] 。 risk[t]是定义的时间t的风险指数。 支持并行计算。 该模拟器使用并行模拟多位患者(您可以通过设置parallel=False来自
2021-12-22 15:05:31
1MB
python
simulator
reinforcement-learning
simulation
1
Reinforcement-Learning-for-Real-time-Pricing-and-Scheduling-Control-in-EV-Charging-Stations:电动汽车充电站实时定价和调度控制的强化学习-源码
2020年11月22日更新 各位, 2020-11-17:我注意到人们正在等待代码。 正如我在某些电子邮件中所说的那样,论文终于在我还是腾讯的时候完成了。 2020年5月,我从腾讯离开,加入了深圳大学。 如您所知,对于一家商业公司,我将所有材料留在腾讯内部。 非常抱歉,无法再提供原始的MATLAB代码。 我将尝试最近在Pytorch中重新实现它。 谢谢。 2020-11-22:上传了pytorch实施。 再次抱歉,我无法提供带有SARSA的原始MATLAB实现。 当我们小组致力于A3C框架的研究工作时,我使用A3C框架实施EV充电环境和功能状态,以提高实施效率。 结果,尽管结果与原始结果略有不同,但快速收敛仍然很重要。 就个人而言,我们的主要贡献是问题的提出和解决,可以在env()函数中找到。 因此,让我在这里停止,再次感谢您的关注。 引用这项工作 S. Wang,S。Bi和YJ Zh
2021-12-21 13:13:43
3.3MB
Python
1
Ada-IRL:Adaboost逆向强化学习-源码
Ada-IRL Adaboost逆向强化学习 一种使用类似于Adaboost的I-Rl算法的方法。 RL 开始进行强化学习的测试演示。 python rl_test.py 内部收益率 开始进行逆向强化学习的测试演示。 python irl_test.py
2021-12-06 17:11:17
8KB
inverse-reinforcement-learning
adaboost-learning
Python
1
强化学习源码
(DP, MC, TD, DQN, PG, AC, A3C, DDPG).zip
包括DP, MC, TD, TD-lambda, DQN, PG, AC, A3C, DDPG, Dyna_Q, Bandit, AlphaGoBangZero以及部分仿真游戏源码
2021-10-14 16:17:05
32.58MB
强化学习
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Autojs 例子 源码 1600多个教程源码
基于yolov4-keras的抽烟检测(源码+数据集)
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
2020年数学建模B题(国二)论文.pdf
算法设计(中文版)和习题解答 Jon_Kleinberg著,张立昂译
华为OD机试真题.pdf
IBM.ILOG.CPLEX.Enterprise.Server.v12.10.0.Win64.rar CPLEX下载
鲸鱼优化算法 WOA matlab源代码(详细注释)
python实现的学生信息管理系统—GUI界面版
云视通扫描工具.zip
2019和2021年华为单板通用硬件笔试题及答案
基于LSTM模型的股票预测模型_python
PSO-LSSVM的MATLAB代码.rar
基于matlab扩频通信系统仿真(整套代码)
ChinaMeteorologicalDataHandler.R
最新下载
VLC万能媒体播放器 银河麒麟(arm64)版离线安装包(3.0.9.2-1版)
openstreetmap:OpenStreetMap的接口(加载地图,提取道路连通性,绘制道路网络并找到最短路径)-源码
snmp_pp.lib
Firefox 52.0.2 渗透便携版 90SEC beta8.7z
cp2112_demo-master.rar
监控目录文件FTP上传程序
Unity:C的简单单元测试
FANUC程序传输工具V16.0.rar
各种音视频测试文件
中科大研一课程算法课后作业答案.rar
其他资源
微信小程序星巴克咖啡源码
C#自定义控件之-自定义MessageBox
中控考勤机SDK及Demo
unity接入腾讯云COS.unitypackage
MFC计算器(vc++)
java用poi转ppt为图片和用pdfbox转pdf为图片的demo
FDC2214串口十进制显示全部28位.zip
打字练习程序汇编语言 打字速度 计时
【C语言】笔记总结—思维导图(超详细!!!)
lis3dh三轴传感器计步实现C源码
FORTRAN_IMSL函数库
GA算法优化支持向量机
c#雷达扇扫图Graphics类WinForm
DC/AC逆变电源的设计
mysql-connector-net-6.9.8、mysql-for-visualstudio-1.2.5
struts2+hibernate整合实现登录注册功能
集装箱号校验,自定义公式
LINQ in Action.rar
发电厂机组主要小指标耗差分析计算图表
STM32F103RCT6+M26 GPRS远程监控板ALTIUM设计硬件原理图+PCB+封装库文件.zip
参考架构:一个社区项目,用于捕获,共享,探索和辩论无服务器生产应用程序中使用的模式和实践-源码
protel99SE设计实例
VMware中CentOS 7设置固定IP同时连接内外网.doc
msp430f449开发板原理图+PCB
QT版聊天软件
县域shp文件
ThinkPHP5.0快速入门控制器入门到精通开发手册3合1