Bee-Agent框架中的消息历史优化策略解析

2025-07-02 18:38:19作者：咎岭娴Homer

背景介绍

在企业级AI应用开发中，特别是在IBM大型机环境下运行的Bee-Agent框架，性能优化是一个关键挑战。当处理复杂的多代理工作流时，不必要的历史消息传递会导致显著的性能下降，这在需要实时响应的业务场景中尤为突出。

问题本质

在Bee-Agent框架的典型工作流中，每个代理步骤默认都会接收完整的对话历史记录。这种设计虽然保证了上下文完整性，但在某些场景下却带来了不必要的开销：

令牌消耗激增：观察数据显示，提示处理消耗了24,879个令牌，而生成消耗了3,826个令牌，其中历史消息占据了主要部分
推理时间延长：完整工作流的总推理时间接近10分钟，这在演示场景中难以接受
资源浪费：中间步骤的代理实际上并不需要完整历史记录即可完成任务

技术解决方案

框架提供了save_intermediate_steps参数来优化这一场景。该参数可以在workflow.add_agent()方法中设置，允许开发者精细控制每个代理步骤对历史消息的处理方式。

典型应用场景

考虑一个包含三个代理的保险理赔处理流程：

Db2数据代理：仅需访问数据库工具和当前提示
视觉分析代理：仅需图像处理工具和当前提示
理赔推理代理：需要前两个代理的结果进行综合判断

在这种工作流中，前两个代理可以安全地禁用历史消息记录，而最后一个代理则需要启用完整历史记录。

实现原理

当save_intermediate_steps=False时，框架会：

仍然执行代理的完整工作流程
将代理的输出保存到消息历史中
但在后续代理调用时，不会将这些中间步骤的完整对话历史传递给LLM

这种设计既保证了工作流的完整性，又避免了不必要的历史消息传递。

性能影响

启用此优化后，可以预期：

令牌使用量显著减少，特别是提示处理部分
总体推理时间大幅缩短
大型机资源利用率提高
更适合实时演示和产品环境

最佳实践建议

仔细分析工作流中每个代理的实际上下文需求
对不需要完整历史的代理步骤启用此优化
在关键决策点保留完整历史记录
通过性能监控验证优化效果

这种精细化的历史消息控制机制体现了Bee-Agent框架对生产环境需求的深入理解，为开发者提供了平衡性能与功能的有效工具。

bee-agent-framework

Framework for building scalable agentic applications.

项目地址：https://gitcode.com/gh_mirrors/be/bee-agent-framework

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java