基于蒙特卡罗树搜索的 Quoridor AI 是一个抽象的策略游戏,在 81 (9x9) 个正方形的棋盘上玩,目标是让你的棋子到棋盘的另一边。 这个玩 Quoridor 的 AI 代理基于 。 纯 MCTS 导致性能不佳。 应用一些启发式方法后,性能得到了显着提高。 我在树搜索的选择、扩展和模拟阶段(以及搜索后的后期处理)添加了启发式方法。 您可以在下面的“包含的一些启发式方法”部分中看到其中的一些。 如果您想查看所有启发式方法或其实现细节,请参阅源代码中的注释。 (找到“启发式”这个词。) 您可以在网站(或 Web 应用程序) 上与此 AI 对战。 网站上每个 AI 级别的每次移动推出次数如下。 等级 每次移动的卷展栏 新手 2,500 平均 7,500 好的 20,000 强的 60,000 最新版本 (v0.3) 中包含的一些启发式方法 Quoridor 的分支因子很
2025-05-20 08:48:09 95KB ai mcts quoridor monte-carlo-tree-search
1
基于蒙特卡罗算法的随机纤维插件:周期对称性与纤维含量的可视化工具,基于蒙特卡罗的随机算法生成具有周期对称性及含量界定的单向随机纤维插件模型,基于蒙特卡罗的随机算法(经典硬核模型orRSA随机吸附法 ),生成单向随机纤维插件,特点: 1.可以画带界面厚度,rve边缘产生的纤维具有周期对称性, 2.画的过程中可以同时显示rve内的纤维个数以及含量,以及界面厚度 ,基于蒙特卡罗的随机算法; RSA随机吸附法; 生成单向随机纤维插件; 周期对称性纤维; 显示RVE纤维个数与含量; 界面厚度。,基于蒙特卡罗算法的随机纤维插件生成工具
2025-04-12 19:43:42 4.97MB 正则表达式
1
\MCNP初学者使用\2.jpg 总有16张
2024-09-18 23:06:03 121KB MCNP初学者使用
1
本文提出蒙特卡洛模拟法并建立蒙特卡洛模型,同时运用Matlab 编写蒙特卡洛模拟算法,并且利用Matlab/OpenDSS的联合仿真进行潮流计算;最后进行该测试系统的分布式光伏最大准入容量统计计算,另外分析影响分布式光伏最大准入容量的因素
2024-05-28 17:05:18 92KB 分布式光伏 opendss matlab
1
关于克拉美罗下界(CRLB)-及不同DOA估计算法下的方差(性能)对比博文对应的代码,包括.m和.txt两种格式文件。
2024-03-26 16:36:37 12KB 克拉美罗 蒙特卡罗
1
蒙特卡罗法(MC)广泛用于模拟光在皮肤组织中的传播。发展了基于四面体网格的蒙特卡罗(TMC)方法,提出了距离阈值的概念避免数值耗散导致的错误能量沉积。通过计算带有单根血管的两层皮肤模型比较了几何蒙特卡罗(GMC)、基于结构化网格的蒙特卡罗(VMC)和TMC。GMC 通过数学定义组织界面,避免了离散,精度最高,但不适用于复杂的界面。VMC 实施简单,但是对曲折表面的离散会导致显著的误差。TMC 使用边界适应性较好的四面体单元在计算的精度和灵活性上找到了平衡。计算结果表明,TMC 法对几何形状的空间适应性远强于VMC,在复杂界面区域的误差仅为VMC 法的10%~25%,是一种理想的边界区域离散化的方法。
2024-03-12 15:21:09 3.79MB 医用光学 蒙特卡罗
1
关于蒙特卡罗方法及其在信号处理中的应用博文相对应的代码,包含txt格式
1
在这项工作中,我们研究了在<math altimg =“ si1.gif” xmlns =“ http://www.w3.org/1998/Math/MathML”>处具有虚磁场iθ的二维和三维反铁磁伊辛模型。 θ = π </ math>。 为了执行系统的数值模拟,我们引入了一种不受符号问题影响的新几何算法。 我们对2D模型的结果与分析解决方案一致。 我们还提出了3D模型的新结果,这些结果定性地与平均场预测相一致。
2023-12-10 13:03:39 768KB Open Access
1
利用蒙特卡罗方法模拟了多层离散随机介质对激光的偏振多次散射,结合激光雷达的特点,给出了半解析蒙特卡罗模拟方法的具体模拟步骤,考虑了光子在随机游走时,跨越分界层时引起的自由程调整,根据Mie 散射相函数对不同介质层进行了散射方向抽样,利用该方法计算了双层和三层水云的雷达多次散射去极化率随穿透深度的变化。从计算结果可以看出,随着穿透深度的增加,雷达去极化率增强,激光在从一种介质入射到另一种介质时,其去极化率增加的速度不同,分析了粒子有效半径、单次散射相函数以及消光系数对雷达去极化率的影响。该方法可以应用于偏振激光雷达对非各向同性云层或气溶胶微物理和光学特性的遥感反演。
1
mcts井字游戏 使用mcts解决井字(3x3)问题。 这样做是为了研究mcts的概念。 youtube演示: : 要求 pygame 怎么玩 python play.py 实施细节 selection :UCT算法( ) expansion :从状态创建所有可能的节点 simulation :随机播放模拟(=随机推出策略)。 这种仿真方法会降低性能。 backprop :向后传播仿真结果。 参考 致谢 为实现算法提供了很多帮助。
2023-04-15 10:37:23 30KB tic-tac-toe mcts Python
1