【亲测免费】 SMAC（StarCraft Multi-Agent Challenge）安装与使用指南

2026-01-16 10:24:37作者：苗圣禹Peter

项目介绍

SMAC，即StarCraft Multi-Agent Challenge，是由WhiRL开发的一个基于Blizzard的即时战略游戏StarCraft II的研究环境，专门设计用于促进合作型多智能体强化学习（Multi-Agent Reinforcement Learning, MARL）领域的研究。该平台允许研究者在复杂的战斗场景中测试算法，支持多种地图和不同的团队协作挑战，确保了实验设置的灵活性和丰富性。

项目快速启动

要开始使用SMAC，首先需要安装必要的软件包。以下是基本的安装步骤：

环境准备

确保你的系统已安装Python和pip。如果需要升级pip，执行以下命令：

pip install --upgrade pip

安装SMAC

你可以通过pip直接安装SMAC，或者从GitHub克隆源码进行安装。推荐使用克隆方式以获得最新特性或参与开发：

直接安装

pip install git+https://github.com/oxwhirl/smac.git

克隆并安装

git clone https://github.com/oxwhirl/smac.git
cd smac
pip install -e .

如果你计划对SMAC进行扩展，应这样安装，包括开发依赖：

pip install -e " [dev]"
pre-commit install

安装StarCraft II

请注意，SMAC需要StarCraft II的游戏客户端（版本>=3.16.1）。请根据SC2的官方说明进行安装。

应用案例和最佳实践

使用SMAC的一个典型应用场景是训练多智能体策略协同作战。下面是一个简单的入门示例，演示如何创建一个环境并执行基础的交互循环：

from smac.env import StarCraft2Env
import numpy as np

def main():
    env = StarCraft2Env(map_name="8m")
    env_info = env.get_env_info()
    n_actions = env_info["n_actions"]
    n_agents = env_info["n_agents"]
    n_episodes = 10

    for e in range(n_episodes):
        env.reset()
        terminated = False
        episode_reward = 0
        while not terminated:
            obs = env.get_obs()
            state = env.get_state()
            
            # 这里应该插入你的智能体决策逻辑
            # 示例中使用随机动作代替实际策略
            actions = [np.random.randint(0, n_actions) for _ in range(n_agents)]
            
            rewards, terminated, _, _ = env.step(actions)
            episode_reward += sum(rewards)
        
        print(f"Episode {e} ended with reward {episode_reward}")