解锁3大核心能力：面向开发者的智能代理构建指南

2026-04-12 10:01:04作者：裴锟轩Denise

智能代理开发正面临效率与复杂度的双重挑战——传统方案要么需要编写大量样板代码，要么受限于固定框架难以扩展。Pydantic AI通过低代码构建模式，让开发者能在30分钟内从0到1实现生产级智能代理，同时保留功能扩展的灵活性。本文将系统介绍如何利用这一框架解决实际业务问题，从基础安装到企业级部署，全面覆盖智能代理开发的关键技术点。

快速搭建：5分钟启动第一个代理服务

为什么大多数AI代理框架让开发者望而却步？因为它们往往要求你先掌握复杂的概念体系，再编写大量配置代码。Pydantic AI颠覆了这一模式，通过"安装即开发"的设计理念，让你专注于业务逻辑而非框架细节。

两种安装模式对比

安装方式	命令	适用场景	依赖体积
标准安装	`uv add pydantic-ai`	完整功能开发	~200MB
精简安装	`uv add "pydantic-ai-slim[openai]"`	生产环境部署	~50MB

标准安装包含所有模型支持和工具集，适合开发阶段使用；精简安装允许按需选择依赖组件，如仅安装OpenAI支持或VertexAI集成，显著减少生产环境的资源占用。

基础代理实现（电商客服场景）

from pydantic_ai import Agent, RunContext
from pydantic import BaseModel

# 定义商品信息数据模型
class ProductInfo(BaseModel):
    name: str
    price: float
    stock: int

# 创建电商客服代理
support_agent = Agent(
    model='openai:gpt-4o',  # 指定使用的LLM模型
    system_prompt='你是电商平台客服，帮助用户查询商品信息和解决订单问题',
    retries=2  # 工具调用失败时自动重试次数
)

# 添加商品查询工具
@support_agent.tool
async def query_product(ctx: RunContext, product_id: str) -> ProductInfo:
    """查询商品信息（内部API调用）"""
    # 实际项目中这里会调用真实的商品服务API
    mock_data = {
        "prod-123": ProductInfo(name="无线耳机", price=299.0, stock=42),
        "prod-456": ProductInfo(name="机械键盘", price=199.0, stock=15)
    }
    return mock_data.get(product_id, ProductInfo(name="未知商品", price=0.0, stock=0))

# 运行代理
async def main():
    result = await support_agent.run("查询商品prod-123的价格和库存")
    print(f"客服回复: {result.output}")

if __name__ == "__main__":
    import asyncio
    asyncio.run(main())

运行命令：python ecommerce_support.py
预期输出：
客服回复: 商品"无线耳机"的价格为299.0元，当前库存42件。

💡 技巧：使用uv而非pip安装可获得更快的依赖解析速度和更一致的环境，特别适合多人协作项目。

⚠️ 避坑指南：首次运行需确保已设置OpenAI API密钥（环境变量OPENAI_API_KEY），否则会出现认证错误。Windows用户可通过PowerShell设置：$env:OPENAI_API_KEY="your_key_here"

核心解密：智能代理的工作原理

你是否好奇当用户提问时，AI代理内部发生了什么？为什么它知道该调用哪个工具，而不是直接回答？Pydantic AI的代理系统通过精妙的设计实现了这种决策能力，让我们深入了解其工作机制。

代理决策流程图

智能代理的决策过程可分为四个阶段：

输入解析：将用户查询转换为结构化请求
工具选择：根据系统提示和工具元数据决定调用哪些工具
执行调度：按最优顺序执行工具并处理结果
响应生成：整合工具返回结果生成自然语言回答

概念卡片：Agent核心组件

组件	定义	使用场景	注意事项
Instructions	开发者为LLM编写的行为指南	定义代理角色和工作流程	保持简洁明确，避免模糊表述
Tool	代理可调用的函数	外部API调用、数据处理等	必须包含详细docstring，帮助LLM理解用途
Output Type	定义代理返回的数据结构	需要结构化响应的场景	使用Pydantic模型可自动验证输出格式
RunContext	代理运行时的上下文对象	传递依赖、跟踪状态	不要在上下文中存储敏感信息

工具调用时序图（以天气查询为例）

用户发起请求："北京和上海今天的天气如何？"
代理解析请求，确定需要调用get_lat_lng工具获取两地坐标
并行调用get_lat_lng("北京")和get_lat_lng("上海")
使用返回的坐标调用get_weather工具获取天气数据
整合两地天气信息，生成自然语言回答

以下是实现这一流程的核心代码：

from pydantic_ai import Agent, RunContext
from pydantic import BaseModel
import asyncio

# 定义经纬度模型
class LatLng(BaseModel):
    lat: float
    lng: float

# 创建天气代理
weather_agent = Agent(
    'openai:gpt-4o',
    instructions='查询多个地点天气时使用并行调用提高效率',
)

# 地点坐标查询工具
@weather_agent.tool
async def get_lat_lng(ctx: RunContext, location: str) -> LatLng:
    """获取地点的经纬度坐标"""
    # 实际项目中这里会调用地理编码API
    mock_data = {
        "北京": LatLng(lat=39.9042, lng=116.4074),
        "上海": LatLng(lat=31.2304, lng=121.4737)
    }
    return mock_data.get(location, LatLng(lat=0.0, lng=0.0))

# 天气查询工具
@weather_agent.tool
async def get_weather(ctx: RunContext, lat: float, lng: float) -> dict:
    """根据经纬度获取天气信息"""
    # 实际项目中这里会调用天气API
    return {"temperature": "18°C", "condition": "晴朗"}

# 并行处理多地点查询
async def main():
    result = await weather_agent.run("北京和上海今天的天气如何？")
    print(result.output)

if __name__ == "__main__":
    import asyncio
    asyncio.run(main())

🔍 深入：Pydantic AI的工具调用支持自动并行化，当LLM检测到多个独立的工具调用时，会自动使用asyncio.gather进行并行执行，大幅提升处理效率。

场景实战：从基础到企业级的演进

数据分析是智能代理的典型应用场景，但不同规模的企业有不同的需求——初创公司可能只需要简单的数据查询，而大型企业则需要复杂的权限控制和审计跟踪。让我们通过"三级递进"模式，构建满足不同需求的数据分析代理。

基础版：销售数据查询代理

from pydantic_ai import Agent, RunContext
from pydantic import BaseModel
from typing import List, Dict

class SalesData(BaseModel):
    product: str
    revenue: float
    units_sold: int

# 基础数据分析代理
data_agent = Agent(
    'openai:gpt-4o',
    system_prompt='你是销售数据分析助手，帮助用户查询和解释销售数据',
)

@data_agent.tool
async def get_sales_data(ctx: RunContext, product: str = None) -> List[SalesData]:
    """获取销售数据，可选按产品筛选"""
    # 模拟数据库查询
    mock_data = [
        SalesData(product="A", revenue=15000.0, units_sold=300),
        SalesData(product="B", revenue=22000.0, units_sold=450),
        SalesData(product="C", revenue=8000.0, units_sold=200),
    ]
    if product:
        return [item for item in mock_data if item.product == product]
    return mock_data

async def main():
    result = await data_agent.run("产品B的销售额和销量是多少？")
    print(result.output)

if __name__ == "__main__":
    import asyncio
    asyncio.run(main())

进阶版：带权限控制的数据分析代理

from pydantic_ai import Agent, RunContext, ToolCall
from pydantic import BaseModel
from typing import List

# 定义用户权限模型
class UserContext(BaseModel):
    department: str
    can_view_all_data: bool = False

# 带权限控制的数据分析代理
secure_data_agent = Agent(
    'openai:gpt-4o',
    deps_type=UserContext,  # 依赖类型指定为用户上下文
    system_prompt=(
        '根据用户部门权限提供销售数据。'
        '若用户没有查看所有数据权限，只返回其部门数据。'
    ),
)

@secure_data_agent.tool
async def get_department_sales(ctx: RunContext[UserContext]) -> List[Dict]:
    """获取用户所在部门的销售数据"""
    # 根据用户上下文过滤数据
    department = ctx.deps.department
    # 模拟部门数据查询
    return [{"product": f"{department}-X", "revenue": 12000.0}]

@secure_data_agent.tool
async def get_all_sales(ctx: RunContext[UserContext]) -> List[Dict]:
    """获取所有部门销售数据（需要管理员权限）"""
    if not ctx.deps.can_view_all_data:
        raise PermissionError("没有查看所有数据的权限")
    # 模拟全量数据查询
    return [
        {"department": "A", "revenue": 15000.0},
        {"department": "B", "revenue": 22000.0}
    ]

async def main():
    # 创建不同权限的用户上下文
    regular_user = UserContext(department="A")
    admin_user = UserContext(department="admin", can_view_all_data=True)
    
    # 普通用户查询
    regular_result = await secure_data_agent.run("我的部门销售数据是多少？", deps=regular_user)
    print("普通用户结果:", regular_result.output)
    
    # 管理员查询
    admin_result = await secure_data_agent.run("所有部门销售数据是多少？", deps=admin_user)
    print("管理员结果:", admin_result.output)

if __name__ == "__main__":
    import asyncio
    asyncio.run(main())

企业版：带监控和持久化的智能分析系统

企业级应用需要完整的监控、日志和状态持久化能力。以下是集成Logfire监控和数据持久化的实现：

from pydantic_ai import Agent, RunContext
from pydantic import BaseModel
import logfire
from sqlalchemy import create_engine, text
from contextlib import asynccontextmanager

# 配置日志监控
logfire.configure()
logfire.instrument_pydantic_ai()

# 数据库连接管理
@asynccontextmanager
async def db_connection():
    engine = create_engine("sqlite:///sales_data.db")
    async with engine.connect() as conn:
        try:
            yield conn
        finally:
            await conn.close()

# 企业级数据分析代理
enterprise_agent = Agent(
    'openai:gpt-4o',
    instructions='企业级销售数据分析助手，支持复杂查询和历史趋势分析',
    retries=3,
)

@enterprise_agent.tool
async def query_sales_database(ctx: RunContext, sql: str) -> List[Dict]:
    """执行销售数据SQL查询"""
    async with db_connection() as conn:
        result = await conn.execute(text(sql))
        return [dict(row) for row in result.mappings()]

@enterprise_agent.tool
async def generate_sales_report(ctx: RunContext, period: str) -> str:
    """生成指定时间段的销售报告"""
    # 实际实现中会调用多个工具生成综合报告
    return f"销售报告（{period}）：总销售额增长15%，主要来自产品B"

async def main():
    with logfire.span("enterprise_agent_run"):
        result = await enterprise_agent.run(
            "生成2023年Q4的销售报告，并分析同比增长情况"
        )
        print(result.output)

if __name__ == "__main__":
    import asyncio
    asyncio.run(main())

监控界面说明：Logfire提供的监控面板展示了代理的完整执行流程，包括LLM调用、工具执行时间和结果状态，帮助开发者快速定位性能瓶颈和错误点。

⚠️ 避坑指南：企业级部署时，务必为工具调用设置超时时间，避免长时间运行的工具阻塞整个代理流程。可通过@tool(timeout=10)装饰器为单个工具设置超时。

部署与扩展：从原型到生产

开发完成的智能代理如何平稳过渡到生产环境？不同的部署策略会直接影响系统的可靠性、可扩展性和维护成本。让我们比较三种主流部署方案，并提供性能优化的实用建议。

部署方案对比

部署方式	实现复杂度	扩展性	适用场景
脚本直接运行	低	低	原型验证、小流量应用
FastAPI服务	中	中	内部工具、中等流量API
Docker容器化	高	高	生产环境、大规模部署

容器化部署实现

Dockerfile：

FROM python:3.11-slim

WORKDIR /app

# 安装依赖
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

# 复制应用代码
COPY . .

# 暴露端口
EXPOSE 8000

# 启动命令
CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "8000"]

docker-compose.yml：

version: '3'
services:
  agent-service:
    build: .
    ports:
      - "8000:8000"
    environment:
      - OPENAI_API_KEY=${OPENAI_API_KEY}
      - LOGFIRE_TOKEN=${LOGFIRE_TOKEN}
    restart: always

运行命令：docker-compose up -d

性能优化建议

连接池复用：为数据库和外部API客户端创建全局连接池，避免频繁建立连接

from httpx import AsyncClient

# 创建全局HTTP客户端
http_client = AsyncClient(limits=AsyncClient Limits(max_connections=100))

工具调用缓存：对频繁调用且结果稳定的工具添加缓存

from functools import lru_cache

@agent.tool
@lru_cache(maxsize=100)
async def get_product_info(product_id: str):
    # 实现代码...

异步批量处理：将多个独立的工具调用并行执行

results = await asyncio.gather(
    get_sales_data("A"),
    get_sales_data("B"),
    get_sales_data("C")
)

模型请求优化：根据查询复杂度动态选择模型

if query_complexity > 0.7:
    model = "openai:gpt-4o"
else:
    model = "openai:gpt-4o-mini"

功能扩展指南

Pydantic AI支持通过工具集（Toolset）扩展代理能力，以下是几种常见的扩展方向：

外部API集成：添加支付网关、物流跟踪等第三方服务调用
知识库检索：集成向量数据库实现企业知识库查询
多模态处理：添加图像识别、语音转文字等多媒体处理能力

应用界面说明：基于Pydantic AI构建的聊天应用界面，支持上下文对话和工具调用，可作为客户服务、技术支持等场景的前端交互方案。

💡 技巧：使用@toolset装饰器可以将相关工具组织成工具集，便于代码维护和权限管理。例如将所有财务相关工具放在FinanceToolset中。

总结与下一步

通过本文的学习，你已经掌握了使用Pydantic AI构建智能代理的核心技术，包括基础安装、代理原理、多场景实战和生产部署。这一框架的优势在于它将复杂的AI代理逻辑抽象为简单的Python代码，同时保持了足够的灵活性以适应不同业务需求。

核心收获

低代码开发：通过装饰器和类型注解大幅减少样板代码
灵活扩展：工具化设计使功能扩展变得简单直观
企业级特性：内置监控、重试和权限控制等生产环境必需功能

进阶学习路径

多代理协作：学习如何设计多个代理协同工作的系统
高级工具集：探索动态工具发现和权限管理功能
自定义模型集成：将私有模型或特定领域模型接入框架

Pydantic AI正在快速发展，定期查看官方文档和示例代码可以获取最新功能和最佳实践。无论你是构建简单的工具助手还是复杂的企业级智能系统，这一框架都能帮助你以更低的成本和更高的效率实现目标。

最后，记住智能代理开发是一个迭代过程——从最小可行产品开始，根据实际使用情况逐步优化和扩展功能，这是成功构建智能应用的关键。

pydantic-ai

AI Agent Framework, the Pydantic way

项目地址：https://gitcode.com/GitHub_Trending/py/pydantic-ai

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

434

395

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.68 K

989