本文研究并借鉴了深度 Q 网络的结构,借鉴其使用一个神经网络处理图像输入并计算行动价值函数,将深度学习与增强学习结合。根据路径规划问题的特殊性设计了一个全卷积神经网络,并引入注意力机制优化网络结构。其次,针对神经网络在处理多步决策、规划问题上的短板,参考价值迭代网络,在神经网络模型的基础上引入价值迭代模块。对价值迭代模块进行解构分析,提出改进的价值迭代模块,解决了引入价值迭代模块造成的误差累积问题。最后,将神经网络表征的行动价值函数分解为状态价值函数与优势函数之和,形成竞争神经网络结构,至此完成神经网络的构建。本文使用 2D 栅格环境,使用专家样本取代传统增强学习中的代理经历,以模仿学习方式加速模型训练。通过算法在最短路径规划问题上的表现衡量算法效能。
Q学习在二维障碍环境下的路径规划,打开文件直接运行即可,傻瓜式操作。Q学习作为强化学习的入门算法在路径规划方面有着一定的效果。
2021-04-02 22:10:34 53KB Q学习 路径规划 轨迹规划 Q-learning
1
JAVA学习路径脑图,java基础知识,java多线程编程,Spring等脑图
2021-02-22 18:05:25 10.06MB JAVA学习路径脑图 java基础 Spring脑图
1
完成本学习路径后,您将能够:  了解数字分类账背后的基本概念,更具体而言,了解区块链技术以及开源 Hyperledger 项目。  根据开源 Hyperledger Fabric 框架创建区块链网络。  使用 IBM Blockchain Platform VS Code 扩展开发智能合约。  构建基本区块链网络,创建并执行区块链智能合约,并从区块链平台发出事件。  利用与 IBM Blockchain Platform 连接的 Blockchain Solution Manager 和 Blockchain Document Store 构建更高级的应用。  通过以太坊虚拟机在本
2021-01-28 05:05:42 23KB IBM 区块链 学习路径
1
个人整理的“Azure 基础知识”学习路径 课后40题 (中文)--- 备考AZ-900.
2021-01-28 02:35:04 152KB azure
1
与本资源相关的思路分析在我的博客里,因为都是工作日志,所以每一篇都不太全,不过可以作为参考,贴两篇比较密集的传送门。 传送门1 是讲AprioriAll算法的:https://blog.csdn.net/w_z_y1997/article/details/80503643 传送门2 是关于基于图谱的推荐部分的: https://blog.csdn.net/w_z_y1997/article/details/80574836
2019-12-21 21:59:52 72KB 知识图谱 AprioriAll 路径推荐
1
【牛客带你学编程】Java学习路径.pdf,完整,权威。适合作为学习的路径。
2019-12-21 20:44:24 452KB Java学习路径
1
用 matlab 仿真A*路径规划算法,有子函数可修改。解压后运行a_star.m即可。生成迷宫中的最短的路径,以及路径搜索的过程。
2019-12-21 18:52:58 16KB MATLAB 机器学习 路径规划
1