基于蒙特卡罗树搜索的 Quoridor AI 是一个抽象的策略游戏,在 81 (9x9) 个正方形的棋盘上玩,目标是让你的棋子到棋盘的另一边。 这个玩 Quoridor 的 AI 代理基于 。 纯 MCTS 导致性能不佳。 应用一些启发式方法后,性能得到了显着提高。 我在树搜索的选择、扩展和模拟阶段(以及搜索后的后期处理)添加了启发式方法。 您可以在下面的“包含的一些启发式方法”部分中看到其中的一些。 如果您想查看所有启发式方法或其实现细节,请参阅源代码中的注释。 (找到“启发式”这个词。) 您可以在网站(或 Web 应用程序) 上与此 AI 对战。 网站上每个 AI 级别的每次移动推出次数如下。 等级 每次移动的卷展栏 新手 2,500 平均 7,500 好的 20,000 强的 60,000 最新版本 (v0.3) 中包含的一些启发式方法 Quoridor 的分支因子很
2025-05-20 08:48:09 95KB ai mcts quoridor monte-carlo-tree-search
1
mcts井字游戏 使用mcts解决井字(3x3)问题。 这样做是为了研究mcts的概念。 youtube演示: : 要求 pygame 怎么玩 python play.py 实施细节 selection :UCT算法( ) expansion :从状态创建所有可能的节点 simulation :随机播放模拟(=随机推出策略)。 这种仿真方法会降低性能。 backprop :向后传播仿真结果。 参考 致谢 为实现算法提供了很多帮助。
2023-04-15 10:37:23 30KB tic-tac-toe mcts Python
1
蒙特卡洛树搜索(MCTS)_井字棋(C++实现)
2022-11-03 11:40:05 36.55MB 人工智能
1
python实现,有界面,蒙特卡洛搜索树,非常整齐,可运行
2022-07-26 12:05:52 7KB mcts 井字棋 python
1
python实现,简洁美观适合初学者,对蒙特卡洛算法有很好的理解,注释齐全
2022-07-26 12:05:50 7KB mcts 翻转棋 python
1
设置 该项目使用rust(夜间频道)python和tensorflow. 安装rustup并启动rustup default nightly以启用夜间编译器。 安装tensorflow以启用 PUCT/AlphaZero/MuZero 策略。 更一般地说,用于pip install -r requirements.txt安装 python 依赖项(tensorflow被排除在列表之外tensorflow)tensorflow-gpu。 用法 Cargo是 Rust 项目经理。用于cargo run --release --bin 执行二进制文件。可用的二进制文件有: evaluate:评估两项突破政策 ui: 检查 alphazero 的交互式界面 generate: 自我游戏生成器 gym_server: openai 健身房的解耦游戏执行器 perf: 基准测试 配置文件 evaluate,generate并且ui都使用位于config/路径中的配置文件。它由--config选项选择。 训练 要执行训练,您需要同时启动 python 和 rust 二进制文件:
2022-06-11 18:06:09 10.36MB rust 算法
Windows Server 2008应用程序基础架构 MCTS Exam 70-643.pdf
2022-05-11 22:01:09 129.21MB windows
1
蒙特卡罗树搜索方法 这是蒙特卡罗树搜索方法的Java实现。 它是独立的,与域无关的,因此可以轻松地在任何状态操作域中使用。 该项目是为我的学士学位论文目的而开发的。 依存关系 JUnit4,Java克隆库 用法 创建MctsDomainAgent的实现。 public class Player implements MctsDomainAgent< State> { ... } 创建MctsDomainState的实现。 public class State implements MctsDomainState< Action> { ... } 初始化搜索并调用uctSearchWithExploration()以获得最有前途的操作。 Mcts< State> mcts = Mcts . initializeIterat
2022-05-09 14:07:41 16KB search tree monte-carlo decision-making
1
内含github中关于MCTS的工程及源码,Python实现,一些简单例子,可学习使用
2022-03-06 19:10:20 71KB MCTS
1
MCTS-扑克 无限注德州扑克的启发式搜索算法。 该引擎旨在查找扑克游戏中的玩家类型集群,并学习预测玩家给定牌的动作的对手模型。 为什么是扑克? 扑克是一种不完全信息的非确定性游戏。 目前,计算机在扑克上的进展并没有取得巨大的成功,而在许多其他游戏中,计算机在确定性和完美信息游戏中都与顶尖的人类玩家处于同一水平。 扑克本身就带来了非常具有挑战性的挑战,具有大量有趣的特性。 项目状态 扑克学习者算法和创建扑克集 (2015-04) 扑克机器人测试 (2015-06) 目前正在开发中,该项目的截止日期是(2015-08) 贡献 查看问题跟踪器(或给我发送电子邮件,有时我懒得更新它) 入门 该项目是在visual studio 2013中构建的,项目结束后将提供完整的文档。
2022-02-10 15:46:49 44KB C++
1