扑克RL 扑克游戏中的多智能体深度强化学习框架。 背景 解决不完善的信息游戏的研究主要围绕直到最近才遍历整个游戏树的方法(例如,请参见 , , )。 神经虚拟自我播放(NFSP) ,后悔策略梯度(RPG) ,深反事实后悔最小化(Deep CFR) 和单深CFR 等新算法最近将深(强化)使用常规方法(例如CFR和虚拟游戏)进行学习,以仅在访问游戏状态的一小部分时即可了解近似的纳什均衡。 PokerRL框架 PokerRL算法的组成部分 您的算法由相互交互的工作人员(绿色)组成。 训练运行的参数通过TrainingProfile的实例( .../rl/base_cls/Training
2021-05-12 11:04:25 325KB framework research reinforcement-learning poker
1
Only one localization algorithm indoor environment has certain error, and the change of localization environment will cause instability of positioning system. The fusion of the position fingerprint matching algorithm and the polynomial distribution model can reduce the influence of the low positioning accuracy caused by the shortcomings of the polynomial distribution model and the position fingerprint matching model. In this paper, the position fingerprint matching algorithm and the polynomial distribution algorithm are respectively used to locate in different environments, and the same parameter is used to quantify the positioning results of the two different algorithms on the same environment. According to the selection coefficient, the optimal algorithm is selected for indoor positioning. In the online positioning stage, an algorithm that can be selected according to the selection coefficient to adapt to the environment can be used to locate. This adaptive algorithm can solve the respective defects of the fingerprint matching algorithm and the polynomial distribution model, and improve the indoor positioning accuracy.
2021-05-11 11:56:19 459KB 室内定位 算法研究
1
卡拉模拟器 CARLA是用于自动驾驶研究的开源模拟器。 CARLA是从零开始开发的,旨在支持自动驾驶系统的开发,培训和验证。 除了开源代码和协议,CARLA还提供了为此目的而创建且可以免费使用的开放数字资产(城市布局,建筑物,车辆)。 该仿真平台支持传感器套件和环境条件的灵活规范。 如果要在与CoRL'17论文相同的条件下对模型进行,请查看 。 推荐系统 英特尔i7第9代-11日/英特尔i9第9代-11日/ AMD ryzen 7 / AMD ryzen 9 +16 GB RAM内存 NVIDIA RTX 2070 / NVIDIA RTX 2080 / NVIDIA RTX 3070,
2021-04-21 11:16:31 84.31MB simulator research ai computer-vision
1
Research on Frequency-Hopping Spread Spectrum protocol with NRF24L01.zip
2021-04-20 19:04:20 25.73MB NRF24L01
Peter Szor是赛门铁克公司安全响应中心的安全架构师,自1999年开始就在该中心设计和改进Norton AntiVirus系列产品采用的反病毒技术,他是著名的计算机病毒和安全研究员,也是反病毒应急讨论网络的创始人之一。
2021-04-20 13:42:14 9.89MB 计算机 病毒
1
FMA:音乐分析数据集 , , , 。 国际音乐信息检索学会会议(ISMIR),2017年。 我们介绍了免费音乐档案(FMA),这是一个开放的且易于访问的数据集,适用于评估MIR中的多个任务,MIR是与浏览,搜索和组织大型音乐收藏有关的领域。 但是,社区对功能和端到端学习的兴趣日益增长,这受到大型音频数据集可用性有限的限制。 FMA旨在克服这一障碍,以161个流派的分级分类法,提供来自16,341位艺术家和14,854张专辑的106,574条曲目的917 GiB和343天的Creative Commons许可音频。 它提供全长和高质量的音频,预先计算的功能,以及轨道和用户级别的元数据
1
临床试验的样本量计算Sample Size Calculations in Clinical Research
2021-04-19 22:23:00 15.08MB 临床试验 样本量
1
一篇关于微电网的综述,覆盖面比较广。值得一读。
2021-04-08 09:12:17 8.1MB MiroGrid
1
天门 天文数据平台 请参阅以获取更多信息。 安装及使用 请参考。
1
贝叶斯神经网络 以下近似推理方法的Pytorch实现: 我们还提供以下代码: 先决条件 火炬 脾气暴躁的 Matplotlib 该项目是用python 2.7和Pytorch 1.0.1编写的。 如果CUDA可用,它将自动使用。 这些模型也不会太大,因此也可以在CPU上运行。 用法 结构体 回归实验 我们对用 生成的玩具数据集和真实数据(六个)进行了均方差和异方差回归实验。 Notebooks / classification /(ModelName)_(ExperimentType).ipynb :包含在(ExperimentType)上使用(ModelName)进行的实验,即同调/异
1