Caldera项目中基于Agent执行顺序的能力调度策略分析

2025-06-04 10:49:04作者：幸俭卉

背景介绍

Caldera作为一款红队自动化平台，其核心功能之一是能够通过定义Adversary Profile来模拟攻击行为。在实际使用中，一个常见需求是希望某些能力(Ability)只在特定的Agent上执行，特别是在多阶段攻击场景中，当第一个Agent部署了第二个Agent后，希望后续能力只在第二个Agent上运行。

技术挑战

在多Agent环境中精确控制能力执行面临几个关键挑战：

默认行为限制：Caldera的默认规划器(Planner)会平等对待所有活跃Agent，无法自动区分新旧Agent
执行环境差异：不同Agent可能运行在不同操作系统或权限级别上
操作可见性：简单的过滤方法会导致大量"失败"操作出现在仪表盘中

解决方案比较

1. Agent分组方案

通过将初始Agent分配到特定组(group)中，可以限制操作仅在该组内执行。这种方法的优点是实现简单，但局限性在于无法反向操作(即无法仅在新Agent上执行)。

2. 基于事实(Fact)的条件执行

在部署新Agent的能力中添加主机名识别逻辑，生成特定事实(Fact)，然后在后续能力中通过条件判断实现选择性执行：

if (#{victim.new.hostname} -eq hostname) {
    # 执行核心逻辑
} else {
    echo "not executed"
}

优缺点分析：

优点：实现相对简单，可扩展性强
缺点：会产生大量"未执行"的操作记录，影响仪表盘清晰度

3. 自定义规划器方案

开发自定义规划器是最灵活和优雅的解决方案。通过继承BasePlanner类并重写相关方法，可以实现：

跟踪Agent创建顺序
基于自定义逻辑过滤候选动作
精确控制能力分配

核心实现思路包括：

维护Agent注册时间记录
实现基于时间戳或顺序的过滤逻辑
集成到现有操作流程中

4. Agent终止方案

在部署新Agent后立即终止旧Agent的执行。这种方法简单直接，但牺牲了旧Agent的持续可用性，不适合需要保留多个活跃Agent的场景。

最佳实践建议

对于不同场景，建议采用不同策略：

简单测试环境：使用条件执行或Agent终止方案
复杂红队演练：开发自定义规划器
长期运营场景：结合分组和条件执行策略

技术实现细节

若选择开发自定义规划器，需要重点关注：

Agent元数据管理：记录Agent注册时间、部署路径等信息
动作过滤算法：基于业务规则确定目标Agent
状态持久化：确保规划器状态在Caldera重启后仍能保持

以下是一个简化的规划器伪代码示例：

class SequentialAgentPlanner(BasePlanner):
    def __init__(self):
        self.agent_registry = {}  # 记录Agent注册时间和顺序
    
    def execute(self, operation):
        # 过滤逻辑实现
        for agent in operation.agents:
            if agent.paw not in self.agent_registry:
                self.agent_registry[agent.paw] = datetime.now()
        
        # 仅选择最新注册的Agent执行
        newest_agent = max(self.agent_registry.items(), key=lambda x: x[1])[0]
        filtered_links = [l for l in operation.chain if l.paw == newest_agent]
        
        # 应用过滤后的链路
        operation.chain = filtered_links