Strands Agents项目实战:构建多智能体工具化架构
2025-06-03 07:42:45作者:董宙帆
引言:智能体工具化架构概述
在现代AI系统设计中,"智能体即工具"(Agents as Tools)是一种日益流行的架构模式。这种模式通过将专业化的AI智能体封装为可调用函数(工具),供其他智能体使用,从而构建出层次化的智能系统结构。
Strands Agents项目为我们提供了一个优秀的实现范例,展示了如何构建这种架构。本文将深入解析该项目的核心设计思想,并通过实际代码示例演示如何实现多智能体协作系统。
核心架构设计原理
1. 分层协作机制
智能体工具化架构包含两个关键层级:
- 协调者智能体(Orchestrator):作为系统的"大脑",负责与用户交互并决定调用哪个专业智能体
- 工具智能体(Tool Agents):各种专业化的智能体,每个都专注于特定领域的任务
这种设计模拟了人类团队的工作方式,类似于一个经理协调多个专业人才共同解决复杂问题。
2. 架构优势分析
采用这种架构模式具有多重优势:
- 关注点分离:每个智能体职责单一,系统更易理解和维护
- 层次化委托:形成清晰的调用链,协调者决定何时调用哪个专家
- 模块化设计:可以独立添加、移除或修改专业智能体而不影响整体系统
- 性能优化:每个智能体可以针对特定任务优化其系统提示和工具
实战开发:构建多智能体系统
1. 环境准备与基础配置
首先需要安装必要的依赖包:
!pip install -r requirements.txt
然后导入核心模块:
import os
from strands import Agent, tool
from strands_tools import file_write
2. 构建研究助手智能体
我们先创建一个基础的研究助手智能体:
RESEARCH_ASSISTANT_PROMPT = """您是一个专业的研究助手。专注于提供
基于事实、来源可靠的信息回应研究问题。
尽可能引用您的资料来源。"""
research_agent = Agent(
system_prompt=RESEARCH_ASSISTANT_PROMPT,
# tools=[http_request] # 可启用AI搜索工具
)
query = "Amazon Bedrock及其功能概述"
response = research_agent(query)
3. 将智能体封装为工具
遵循最佳实践,我们将研究助手封装为可调用工具:
@tool
def research_assistant(query: str) -> str:
"""
处理并回应研究相关查询。
参数:
query: 需要事实信息的研究问题
返回:
带有引用的详细研究回答
"""
try:
research_agent = Agent(
system_prompt=RESEARCH_ASSISTANT_PROMPT,
)
response = research_agent(query)
return str(response)
except Exception as e:
return f"研究助手错误: {str(e)}"
4. 构建更多专业智能体
产品推荐助手
@tool
def product_recommendation_assistant(query: str) -> str:
"""
处理产品推荐查询,根据用户偏好建议合适产品。
参数:
query: 包含用户偏好的产品查询
返回:
带有推理的个性化产品推荐
"""
try:
product_agent = Agent(
system_prompt="""您是一个专业的产品推荐助手。
根据用户偏好提供个性化产品建议。始终引用您的来源。""",
)
response = product_agent(query)
return str(response)
except Exception as e:
return f"产品推荐错误: {str(e)}"
旅行规划助手
@tool
def trip_planning_assistant(query: str) -> str:
"""
创建旅行行程并提供旅行建议。
参数:
query: 包含目的地和偏好的旅行规划请求
返回:
详细的旅行行程或旅行建议
"""
try:
travel_agent = Agent(
system_prompt="""您是一个专业的旅行规划助手。
根据用户偏好创建详细的旅行行程。""",
)
response = travel_agent(query)
return str(response)
except Exception as e:
return f"旅行规划错误: {str(e)}"
5. 构建协调者智能体
协调者智能体是整个系统的核心,负责路由请求:
MAIN_SYSTEM_PROMPT = """
您是一个将查询路由到专业智能体的助手:
- 研究问题和事实信息 → 使用research_assistant工具
- 产品推荐和购物建议 → 使用product_recommendation_assistant工具
- 旅行规划和行程 → 使用trip_planning_assistant工具
- 不需要专业知识的简单问题 → 直接回答
始终根据用户查询选择最合适的工具。
"""
orchestrator = Agent(
system_prompt=MAIN_SYSTEM_PROMPT,
tools=[
research_assistant,
product_recommendation_assistant,
trip_planning_assistant,
file_write,
],
)
6. 系统运行示例
处理产品查询
customer_query = "我正在寻找登山靴。将最终响应写入当前目录。"
os.environ["BYPASS_TOOL_CONSENT"] = "true"
response = orchestrator(customer_query)
处理旅行查询
customer_query = "你能帮我规划去巴塔哥尼亚的旅行吗"
response = orchestrator(customer_query)
复杂多任务处理
query = "你能研究一下西班牙吗?同时帮我规划7天的旅行。"
orchestrator(query)
在这个例子中,协调者会:
- 首先调用research_assistant
- 然后调用trip_planning_assistant
- 将两个专业响应组合成连贯的答案
高级技巧:智能体间通信模式
1. 序列化智能体协作
我们可以让多个智能体按顺序协作处理任务:
@tool
def research_assistant_2(topic: str):
"""
处理并回应研究相关查询。
参数:
topic: 需要事实信息的研究主题
返回:
带有引用的详细研究回答
"""
research_agent = Agent(
system_prompt=RESEARCH_ASSISTANT_PROMPT,
)
summary_agent = Agent(
system_prompt="""
您是一个专注于将复杂信息提炼为清晰、简洁摘要的专家。
您的主要目标是提取关键点、主要论点和关键数据。
您应该保持原始内容的准确性,同时使其更易于消化。
专注于清晰度、简洁性和突出信息的最重要方面。
""",
)
print("多个智能体创建成功!")
print(f"\n🔍 研究智能体正在处理: {topic}\n")
try:
research_response = research_agent(
f"请收集关于{topic}的全面信息。"
)
research_text = research_response.message.content[0]["text"]
print("\n✂️ 摘要智能体正在提炼研究\n")
summary_response = summary_agent(
f"请创建这份研究的简明摘要: {research_text}"
)
summary_text = summary_response.message.content[0]["text"]
return str(summary_text)
except Exception as e:
return f"研究助手错误: {str(e)}"
2. 使用use_llm工具
Strands Agents提供了use_llm工具,可以动态创建特定功能的智能体:
from strands import Agent
from strands_tools import stop, use_llm
agent = Agent(
tools=[use_llm, stop],
system_prompt="使用use_llm工具创建一个诗歌写作助手,可以写关于给定主题的短诗。",
)
llm_response = agent("主题: 人工智能。")
最佳实践总结
在实现"智能体即工具"模式时,应遵循以下最佳实践:
- 清晰的工具文档:为每个智能体编写描述性文档字符串,明确其专业领域
- 专注的系统提示:保持每个专业智能体严格专注于其领域
- 一致的响应处理:使用统一模式提取和格式化响应
- 工具选择指导:为协调者提供明确的标准来判断何时使用每个专业智能体
结语
通过Strands Agents项目,我们看到了构建复杂多智能体系统的优雅方式。这种"智能体即工具"的架构模式不仅提高了系统的模块化和可维护性,还通过专业化分工显著提升了整体性能。希望本文能帮助您理解并应用这一强大的设计模式。
登录后查看全文
热门项目推荐
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
unified-cache-managementUnified Cache Manager(推理记忆数据管理器),是一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理并持久化推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。Python03
MiniCPM-V-4_5MiniCPM-V 4.5 是 MiniCPM-V 系列中最新且功能最强的模型。该模型基于 Qwen3-8B 和 SigLIP2-400M 构建,总参数量为 80 亿。与之前的 MiniCPM-V 和 MiniCPM-o 模型相比,它在性能上有显著提升,并引入了新的实用功能Python00
HunyuanWorld-Mirror混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00
MiniMax-M2MiniMax-M2是MiniMaxAI开源的高效MoE模型,2300亿总参数中仅激活100亿,却在编码和智能体任务上表现卓越。它支持多文件编辑、终端操作和复杂工具链调用Python00
Spark-Scilit-X1-13B科大讯飞Spark Scilit-X1-13B基于最新一代科大讯飞基础模型,并针对源自科学文献的多项核心任务进行了训练。作为一款专为学术研究场景打造的大型语言模型,它在论文辅助阅读、学术翻译、英语润色和评论生成等方面均表现出色,旨在为研究人员、教师和学生提供高效、精准的智能辅助。Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile014
Spark-Chemistry-X1-13B科大讯飞星火化学-X1-13B (iFLYTEK Spark Chemistry-X1-13B) 是一款专为化学领域优化的大语言模型。它由星火-X1 (Spark-X1) 基础模型微调而来,在化学知识问答、分子性质预测、化学名称转换和科学推理方面展现出强大的能力,同时保持了强大的通用语言理解与生成能力。Python00- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00
项目优选
收起
deepin linux kernel
C
24
7
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
291
2.62 K
Ascend Extension for PyTorch
Python
123
149
暂无简介
Dart
580
127
React Native鸿蒙化仓库
JavaScript
227
306
仓颉编译器源码及 cjdb 调试工具。
C++
121
352
仓颉编程语言运行时与标准库。
Cangjie
130
365
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.05 K
610
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
606
184
openGauss kernel ~ openGauss is an open source relational database management system
C++
155
205