PettingZoo 开源项目教程

2026-01-23 05:14:57作者：裴麒琰

1. 项目介绍

PettingZoo 是一个用于多智能体强化学习（Multi-Agent Reinforcement Learning, MARL）的 Python 库，类似于 Gymnasium 的多智能体版本。它提供了一个标准的 API，用于创建和研究多智能体环境。PettingZoo 包含多种类型的环境，如 Atari 游戏、Butterfly 图形游戏、经典游戏、MPE（多智能体粒子环境）等。

PettingZoo 的主要目标是简化多智能体强化学习研究的过程，提供一个统一的接口来处理不同类型的多智能体环境。项目的主要维护者是 Farama 团队，他们还开发了其他相关的工具和库，如 SuperSuit。

2. 项目快速启动

安装

首先，确保你已经安装了 Python 3.8 及以上版本。然后，你可以通过 pip 安装 PettingZoo 库：

pip install pettingzoo

如果你需要安装特定环境系列的依赖项，可以使用以下命令：

pip install 'pettingzoo[atari]'  # 安装 Atari 环境依赖
pip install 'pettingzoo[all]'    # 安装所有环境依赖

基本使用

以下是一个简单的示例，展示如何使用 PettingZoo 创建一个环境并进行交互：

from pettingzoo.butterfly import pistonball_v6

# 初始化环境
env = pistonball_v6.env()

# 重置环境
env.reset()

# 与环境交互
for agent in env.agent_iter():
    observation, reward, termination, truncation, info = env.last()
    action = None if termination or truncation else env.action_space(agent).sample()
    env.step(action)

# 关闭环境
env.close()

3. 应用案例和最佳实践

应用案例

PettingZoo 可以应用于多种场景，如：

游戏开发：使用 PettingZoo 创建和测试多智能体游戏，如多人 Atari 游戏。
机器人控制：在机器人控制领域，PettingZoo 可以用于模拟多机器人协作任务。
自动驾驶：在自动驾驶研究中，PettingZoo 可以用于模拟多车辆之间的交互和协作。

最佳实践

环境版本控制：PettingZoo 对环境进行了严格的版本控制，确保实验的可重复性。在发布研究成果时，务必注明所使用的环境版本。
使用 SuperSuit：SuperSuit 是 PettingZoo 的配套库，提供了多种常用的强化学习环境包装器（如帧堆叠、观察归一化等），建议在实际应用中使用。