# 基于PyTorch的多智能体强化学习算法MADDPG复现
## 项目简介
本项目旨在复现多智能体强化学习领域中的经典算法MADDPG(MultiAgent Deep Deterministic Policy Gradient)。MADDPG是一种适用于混合合作与竞争环境的算法,通过集中式训练和分布式执行的方式,使每个智能体能够基于自身和其他智能体的动作状态进行学习。项目使用Python和PyTorch框架实现,并采用了PettingZoo的MPE(MultiAgent Particle Environment)环境进行实验。
## 项目的主要特性和功能
1. 多智能体环境支持支持PettingZoo的MPE环境,允许在多种多智能体场景下进行训练和测试。
2. MADDPG算法实现实现了MADDPG算法的核心逻辑,包括智能体的创建、动作选择、网络训练等。
3. 模型保存与加载提供模型保存和加载功能,便于实验的连续性和结果的复现。
2025-05-14 20:33:25
592KB
1