从入门到精通：用Pydantic AI构建智能代理应用的完整指南

2026-03-14 06:14:25作者：盛欣凯Ernestine

在当今AI驱动的开发环境中，构建智能代理应用面临两大核心挑战：如何高效管理LLM（大型语言模型）与工具的交互流程？怎样在保证功能强大的同时简化开发复杂度？Pydantic AI作为一款专为LLM交互设计的框架，通过类型安全的工具定义、自动化的函数调用流程和全面的监控能力，为解决这些问题提供了优雅的解决方案。本文将带你深入了解Pydantic AI的核心价值，掌握从基础到企业级应用的全流程开发技能，让你在30分钟内从零构建可生产的智能代理应用。

为什么选择Pydantic AI？3大核心优势解析

Pydantic AI在众多AI代理框架中脱颖而出，源于其独特的设计理念和技术优势：

1. 类型安全的工具定义系统

通过Pydantic模型定义工具输入输出，实现编译级别的错误检查，避免运行时类型错误。这种"契约式编程"确保工具调用的可靠性，减少调试时间。

2. 自动化的函数调用流程

框架自动处理函数调用的解析、参数验证和结果处理，开发者无需编写繁琐的JSON解析代码，专注于业务逻辑实现。

3. 内置可观测性解决方案

集成Logfire监控系统，提供工具调用追踪、性能指标分析和错误报警功能，满足生产环境的可观测性需求。

如何解决AI代理开发的4大痛点？

痛点1：工具调用流程管理混乱

解决方案：通过Agent抽象统一管理工具集和交互逻辑

from pydantic_ai import Agent

# 创建包含工具的代理
weather_agent = Agent(
    'openai:gpt-4.1-mini',
    instructions='使用提供的工具查询天气信息',
)

# 注册工具函数
@weather_agent.tool
async def get_lat_lng(location: str) -> dict:
    """获取地点的经纬度坐标"""
    # 实现逻辑...

痛点2：复杂的错误处理与重试机制

解决方案：内置重试策略和异常处理

# 配置自动重试
weather_agent = Agent(
    'openai:gpt-4.1-mini',
    retries=3,  # 最多重试3次
    retry_delay=1.0,  # 重试间隔1秒
)

痛点3：缺乏有效的调试和监控手段

解决方案：集成Logfire实现全链路监控

import logfire

# 启用监控
logfire.configure()
logfire.instrument_pydantic_ai()

痛点4：上下文管理与依赖注入复杂

解决方案：类型化的依赖管理系统

from dataclasses import dataclass

@dataclass
class Deps:
    http_client: AsyncClient

# 定义依赖类型
weather_agent = Agent(
    'openai:gpt-4.1-mini',
    deps_type=Deps,
)

# 在工具中使用依赖
@weather_agent.tool
async def get_weather(ctx, lat: float, lng: float) -> dict:
    response = await ctx.deps.http_client.get(...)

5分钟完成环境配置：零基础也能上手的安装指南

标准安装（推荐）

适用于大多数场景，包含完整功能：

pip install pydantic-ai

精简安装（按需选择）

针对资源受限环境，仅安装必要组件：

pip install "pydantic-ai-slim[openai]"

支持的可选依赖组包括：openai、anthropic、logfire等，可组合安装：

pip install "pydantic-ai-slim[openai,anthropic,logfire]"

3个层级实践：从基础到企业级应用

基础操作：构建你的第一个智能代理

创建一个简单的轮盘赌代理，演示核心概念：

from pydantic_ai import Agent, RunContext

# 创建代理实例
roulette_agent = Agent(
    'openai:gpt-4o',  # 使用的LLM模型
    deps_type=int,     # 依赖类型（中奖号码）
    output_type=bool,  # 输出类型（是否中奖）
    system_prompt='使用roulette_wheel函数判断用户是否中奖',
)

# 定义工具函数
@roulette_agent.tool
async def roulette_wheel(ctx: RunContext[int], square: int) -> str:
    """检查用户选择的数字是否中奖"""
    return 'winner' if square == ctx.deps else 'loser'

# 运行代理
async def main():
    result = await roulette_agent.run(7, deps=7)  # 用户选择7，中奖号码也是7
    print(f"是否中奖: {result.output}")  # 输出: 是否中奖: True

if __name__ == '__main__':
    import asyncio
    asyncio.run(main())

执行效果：程序将输出是否中奖: True，表明用户选择的数字与中奖号码匹配。

进阶功能：构建天气查询代理

这个案例展示如何组合多个工具、处理依赖和启用监控：

from pydantic_ai import Agent, RunContext
from pydantic import BaseModel
import asyncio
from httpx import AsyncClient
import logfire

# 配置日志监控
logfire.configure(send_to_logfire='if-token-present')
logfire.instrument_pydantic_ai()

# 定义依赖类型
class Deps:
    client: AsyncClient

# 创建天气代理
weather_agent = Agent(
    'openai:gpt-4.1-mini',
    instructions='简洁回答，用一句话总结天气情况',
    deps_type=Deps,
    retries=2,  # 失败时重试2次
)

# 定义经纬度数据模型
class LatLng(BaseModel):
    lat: float
    lng: float

# 定义获取经纬度的工具
@weather_agent.tool
async def get_lat_lng(ctx: RunContext[Deps], location: str) -> LatLng:
    """获取地点的经纬度坐标"""
    response = await ctx.deps.client.get(
        'https://demo-endpoints.pydantic.workers.dev/latlng',
        params={'location': location}
    )
    response.raise_for_status()
    return LatLng.model_validate_json(response.content)

# 定义获取天气的工具
@weather_agent.tool
async def get_weather(ctx: RunContext[Deps], lat: float, lng: float) -> dict:
    """根据经纬度获取天气信息"""
    temp_res, desc_res = await asyncio.gather(
        ctx.deps.client.get('https://demo-endpoints.pydantic.workers.dev/number', 
                          params={'min': 10, 'max': 30}),
        ctx.deps.client.get('https://demo-endpoints.pydantic.workers.dev/weather',
                          params={'lat': lat, 'lng': lng})
    )
    return {
        'temperature': f'{temp_res.text} °C',
        'description': desc_res.text
    }

# 运行代理
async def main():
    async with AsyncClient() as client:
        logfire.instrument_httpx(client)  # 监控HTTP请求
        deps = Deps(client=client)
        result = await weather_agent.run(
            '伦敦和威尔特郡的天气怎么样？', deps=deps
        )
        print('天气情况:', result.output)

if __name__ == '__main__':
    asyncio.run(main())

执行效果：程序将输出类似"伦敦气温18°C，晴天；威尔特郡气温16°C，多云"的天气总结。

通过Logfire监控系统，我们可以直观地看到代理的运行流程和工具调用情况：

这个监控面板展示了代理执行的完整时间线，包括LLM调用、工具执行和结果返回的各个阶段，帮助开发者追踪和优化应用性能。

企业应用：构建实时聊天系统

将Pydantic AI集成到FastAPI Web服务中，实现持续对话能力：

from fastapi import FastAPI, Depends
from fastapi.responses import StreamingResponse
from pydantic_ai import Agent
from datetime import datetime, timezone
import json
from typing import AsyncGenerator

app = FastAPI(title="Pydantic AI 聊天应用")

# 创建聊天代理
chat_agent = Agent(
    'openai:gpt-4o',
    instructions='以友好自然的方式与用户交流，保持对话连贯性'
)

# 数据库依赖
async def get_db():
    db = Database()  # 假设这是一个数据库连接
    try:
        yield db
    finally:
        await db.close()

@app.post("/chat")
async def chat(
    prompt: str, 
    db=Depends(get_db)
) -> StreamingResponse:
    """处理聊天请求并流式返回响应"""
    
    async def message_stream() -> AsyncGenerator[bytes, None]:
        # 发送用户消息
        yield json.dumps({
            'role': 'user',
            'content': prompt,
            'timestamp': datetime.now(timezone.utc).isoformat()
        }).encode() + b'\n'
        
        # 获取历史对话
        history = await db.get_chat_history()
        
        # 运行代理并流式响应
        async with chat_agent.run_stream(
            prompt, message_history=history
        ) as result:
            async for chunk in result.stream_output(debounce_by=0.01):
                yield json.dumps({
                    'role': 'assistant',
                    'content': chunk,
                    'timestamp': datetime.now(timezone.utc).isoformat()
                }).encode() + b'\n'
        
        # 保存新对话
        await db.save_messages(result.new_messages_json())
    
    return StreamingResponse(message_stream(), media_type="text/event-stream")

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)

执行效果：启动服务后，通过WebSocket或HTTP流接收实时消息，实现类似聊天应用的交互体验。

这个聊天界面展示了用户与AI代理的对话过程，支持上下文记忆和实时响应，界面简洁直观。

企业级监控与优化：提升AI代理可靠性的5个技巧

1. 关键指标监控

通过Logfire监控系统跟踪关键指标：

代理响应时间
工具调用成功率
LLM API错误率
令牌使用量统计

2. 性能优化策略

连接池复用：共享HTTP客户端实例减少连接开销
结果缓存：缓存频繁调用的工具结果
批量处理：合并相似的工具调用请求
模型选择：根据任务复杂度动态选择不同能力的模型

3. 错误处理最佳实践

实现指数退避重试策略
添加断路器模式防止级联失败
设计优雅降级方案应对API不可用
详细记录错误上下文便于调试

4. 安全加固措施

输入验证防止注入攻击
敏感信息过滤与脱敏
工具调用权限控制
API密钥安全管理

5. 成本控制方法

设置令牌使用上限
实现请求节流
非关键任务使用更经济的模型
缓存LLM响应避免重复计算

3个立即尝试的扩展方向

1. 多代理协作系统

构建多个专业代理（天气代理、新闻代理、数据分析代理），通过主代理协调它们的工作，实现更复杂的任务处理。

2. 知识库增强的RAG应用

集成向量数据库，为代理添加长期记忆能力，实现基于文档的问答系统，适用于企业知识库、产品文档查询等场景。

3. 智能工作流自动化

结合Pydantic Graph功能，构建可视化的AI工作流，实现复杂业务流程的自动化处理，如客户支持、内容创作、数据分析等。

总结：开启智能代理开发新旅程

Pydantic AI通过类型安全的工具定义、自动化的函数调用流程和内置的监控能力，大幅降低了智能代理应用的开发门槛。无论是构建简单的工具调用代理，还是复杂的企业级聊天系统，Pydantic AI都能提供清晰的架构和强大的功能支持。

通过本文介绍的基础安装、核心概念和实践案例，你已经具备了构建生产级AI代理应用的基础知识。下一步，你可以深入探索官方文档中的高级功能，如多代理协作、持久化工作流和自定义工具集等，不断扩展你的AI应用能力。

现在就动手尝试吧！下载项目代码，运行示例应用，开始你的智能代理开发之旅：

git clone https://gitcode.com/GitHub_Trending/py/pydantic-ai
cd pydantic-ai
pip install -e .
python examples/pydantic_ai_examples/weather_agent.py

pydantic-ai

AI Agent Framework, the Pydantic way

项目地址：https://gitcode.com/GitHub_Trending/py/pydantic-ai

登录后查看全文

项目优选

收起

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。