这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手) ◉ 简介:这是本书的第二版,旨在为所有相关学科的读者提供一个清晰的、简单的强化学习关键思想&算法的说明。书籍在第一版的基础上,增加了近些年新的研究主题,内容重点放在核心的算法上。 ◉ 目录: 介绍 多臂老虎机 有限马尔可夫决策过程 动态规划 蒙特卡罗方法 时差学习 n-step Bootstrapping 使用表格方法进行规划和学习 带近似的策略预测 带近似的策略控制 带近似的离策略方法 资格痕迹 策略梯度方法 心理学 神经科学 应用与案例研究 前沿
2022-12-29 20:28:28 8.21MB 人工智能 强化学习 算法 动态规划
1
基于生物启发式算法的多智能体强化学习算法,强化学习,生物启发算法
2022-12-12 11:28:44 6.22MB 强化学习 多智能体
基于生物启发式算法的多智能体强化学习算法matlab和python实现
2022-12-12 11:28:43 121.21MB matlab 强化学习 自学习 python
2048健身房 该存储库是一个有关使用DQN(Q-Learning)玩2048游戏并使用加速和加速环境的。使用的算法来自“ ,环境是自定义的 env。该环境包含两种类型的电路板表示形式:二进制和无二进制。第一个使用幂二矩阵来表示电路板的每个图块。相反,没有二进制文件使用原始矩阵板。 该模型使用两种不同类型的神经网络:CNN(卷积神经网络),MLP(多层感知器)。使用CNN作为特征提取器比使用MLP更好。可能是因为CNN可以提取空间特征。结果,代理在1000个已玩游戏的10%中获得2048个图块。 奥图纳 Optuna是一个自动超参数优化软件框架,专门为机器学习而设计。它具有命令式,按运行定义样式的用户API。多亏了我们的运行定义API,用Optuna编写的代码具有高度的模块化,并且Optuna的用户可以动态构造超参数的搜索空间。 还有就是如何使用这个库指南。 Numba 是一种开源JI
1
两段强化学习算法,提供给研究算法的同学。不知道有没有用
1
本文以深度强化学习为基础,设计出一种适用于求解大规模车辆路径问题的模型架 构。采用了预训练模型+基于相对位置的 Transformer网络+A2C强化学习训练框架,为 后续研究大规模车辆路径问题的扩展问题和大规模组合优化问题提供了新的深度强化 学习算法框架。本文中的深度强化学习算法解决了以下问题: (1) 不同规模算例可以共享并继承其他规模训练完的模型,在这种共享模型的机制下, 避免了算例规模相近的模型的重复训练。 (2) 预训练模型能够继承其他规模训练出的模型经验,相对位置节点提高了在大规模 车辆路径问题中特征抓取的精确性,A2C强化学习训练框架环节采用无监督学习, 在无标签训练集中训练中规避经验回溯问题,这三方面针对大规模车辆路径问题 做出的调整,提高了训练效率和收敛效果。 (3) 通过预训练机制解决了大规模车辆路径问题内存溢出的情况,解决了目前已有算 法在大规模算例训练时,内存溢出训练中断等问题。 (4) 与经典的启发式算法和元启发式算法进行比较,在同等求解速度的算法中,本文 算法的求解质量方面全面超越这些算法。并且在当前已有的深度强化学习解决方 案中,本文设计的算法和效
2022-09-02 19:07:15 4.58MB 深度强化学习 VRP
1
DRL用于微电网能源管理 我们针对微电网的能源管理系统问题研究了各种深度强化学习算法的性能。 我们提出了一种新颖的微电网模型,该模型由风力涡轮发电机,储能系统,恒温控制负载,价格响应负载以及与主电网的连接组成。 拟议的能源管理系统旨在通过定义优先级资源,直接需求控制信号和电价来在不同的灵活性来源之间进行协调。 本文实现了七种深度强化学习算法,并进行了实证比较。 数值结果表明,不同的深度强化学习算法在收敛到最优策略的能力上存在显着差异。 通过将经验重播和第二个半确定性训练阶段添加到众所周知的“异步优势演员评论家”算法中,我们获得了更好的性能,并且在能效和经济价值方面收敛于高级策略。 有关此项目的更多信息,访问: :
2022-08-25 22:54:53 22.94MB HTML
1
【翻译原创】对on-policy deep actor-critic算法有影响的参数
2022-07-16 09:07:06 1.57MB 强化学习 算法 python 经验分享
1
强化学习算法在供应链环境下的库存控制中的应用.pdf
2022-07-11 19:13:36 143KB 文档资料
各种强化学习算法
2022-06-19 21:55:35 109KB 各种强化学习算法
1