MemGPT项目中核心内存更新导致代理停止执行的问题分析

2025-05-14 05:38:19作者：咎竹峻Karen

问题概述

在MemGPT项目使用过程中，发现当代理(agent)调用core_memory_append或core_memory_replace工具更新核心内存后，会出现执行中断的现象。这一问题在使用GPT-4o模型时表现尤为明显和稳定，而在使用Letta-Free或GPT-4.5模型时则表现不一致或完全正常。

问题重现与验证

通过在不同环境下的测试验证了这一问题的存在性：

云环境测试：在Google Cloud Run上部署的Docker容器中，使用GPT-4o模型创建"start-from-scratch"代理，发送"请添加一个核心记忆说我住在加利福尼亚"的指令后，代理成功更新了核心内存但未返回任何响应。
本地环境测试：为排除云环境干扰，在本地MacBook Pro(M3 Max芯片)上运行Docker容器进行测试，结果与云环境一致，确认问题非环境特定。
模型对比测试：当切换至GPT-4.5-preview模型时，代理能够正常响应，表明问题与模型选择密切相关。

技术分析

深入分析发现，问题的根源在于不同模型对request_heartbeat参数的处理方式不同：

GPT-4o模型在调用工具后会发送{"request_heartbeat": false}，这导致代理执行终止
GPT-4.5-preview模型则发送{"request_heartbeat": true}，使代理继续执行

request_heartbeat参数是控制代理是否继续执行的关键标志。当设置为false时，代理会认为当前任务已完成，从而终止后续处理；而true值则指示代理保持活跃状态，等待进一步指令。

解决方案与建议

针对这一问题，MemGPT项目提供了几种解决方案：

模型选择方案：优先使用GPT-4.5-preview或Letta-Free模型，这些模型在工具调用方面表现更为稳定。值得注意的是，GPT-4o-mini在工具调用方面的表现反而优于完整版GPT-4o。
工具规则配置：通过配置工具规则，可以显式地防止代理在特定工具调用后终止。具体做法是为不希望代理终止的工具添加相应的规则配置。
代码层面修改：对于有开发能力的用户，可以考虑修改工具执行器的相关代码，强制设置request_heartbeat为true，确保代理行为的连贯性。