Phidata项目中消息历史存储冗余问题的分析与优化

2025-05-07 16:39:25作者：余洋婵Anita

问题背景

在Phidata项目的Agent实现中，当启用存储功能用于创建记忆、摘要等功能时，系统会保留聊天历史的冗余副本。这种现象导致了存储空间的膨胀，并影响了系统响应效率。特别是在使用Firestore等NoSQL数据库作为存储后端时，这一问题表现得尤为明显。

技术实现分析

当前系统的消息存储机制采用了双重存储策略：

全局消息存储：在session["memory"]中保存了整个会话期间的所有消息
运行级别存储：在session["memory"]["response"]["runs"]中保存了每次Agent运行时发送给模型的具体消息

当配置参数num_history_responses设置为较大数值时（如30），系统会将过去多次运行的消息都包含在模型上下文中，这导致了两处存储的内容高度相似。

问题本质

深入分析后，我们可以发现几个关键问题点：

存储冗余：系统在多个位置保存了相同的消息内容，特别是当包含长篇系统指令时，这种冗余会显著增加存储开销
历史消息获取逻辑：当前实现通过遍历所有运行记录来获取历史消息，而实际上这些信息已经完整保存在最近一次运行记录中
参数命名误导：num_history_responses参数实际控制的是考虑多少个"运行"而非消息数量，这与参数名称的直观理解存在偏差

性能影响

这种实现方式在长时间对话场景下会带来明显的性能问题：

存储空间膨胀：每次运行都会复制之前的消息历史，导致存储需求呈线性增长
网络传输开销：在云端部署场景下，大量冗余数据的传输会增加延迟
处理时间增加：系统需要遍历多个运行记录来构建消息历史，增加了处理时间

优化方案

经过技术评估，我们提出以下优化方向：

简化存储结构：仅保留最近一次运行的完整记录，避免消息的多重存储
优化历史获取逻辑：直接从最近运行记录中获取完整消息历史，避免遍历所有运行记录
参数语义调整：考虑将num_history_responses重命名为更能反映其实际功能的名称，如num_historical_runs

实现示例

基于上述分析，我们可以实现一个轻量级的AgentMemory子类：

class LightAgentMemory(AgentMemory):
    """
    优化版的AgentMemory实现，仅保留最近一次运行记录
    避免存储冗余消息导致的性能问题
    """
    def add_run(self, agent_run: AgentRun) -> None:
        """
        重写add_run方法，仅存储最新运行记录
        并清理不必要的冗余数据
        """
        agent_run.response.extra_data = None
        agent_run.response.messages = None
        agent_run.response.metrics = None
        self.runs = [agent_run]
        
    def get_messages_from_last_n_runs(self, last_n: Optional[int] = None, skip_role: Optional[str] = None) -> List[Message]:
        """直接从messages列表获取历史消息，避免遍历运行记录"""
        return [message for message in self.messages]