基于OpenAI Agents Python框架集成Ollama本地模型的实践指南

2025-05-25 22:04:54作者：吴年前Myrtle

背景与问题场景

在AI应用开发领域，OpenAI官方推出的Agents Python框架为构建多智能体系统提供了强大支持。然而当开发者尝试将本地部署的Ollama模型与该框架集成时，常会遇到API连接异常和功能兼容性问题。本文将系统性地介绍解决方案。

核心问题解析

通过分析实践案例，我们发现主要存在两个技术难点：

API连接配置问题：框架默认需要OpenAI格式的API端点，直接连接Ollama服务时会出现认证错误
模型功能兼容性问题：部分Ollama模型缺乏工具调用(tool calling)能力，导致智能体协作流程中断

解决方案实现

基础连接配置

正确的客户端初始化方式如下：

from openai import AsyncOpenAI
from agents import set_default_openai_client, set_tracing_disabled

client = AsyncOpenAI(
    base_url='http://localhost:11434/v1',
    api_key='ollama'  # 占位参数，实际可忽略
)
set_default_openai_client(client)
set_tracing_disabled(True)  # 禁用非必要追踪

模型选择建议

对于基础对话场景，推荐使用以下经过验证的模型：

Gemma系列：适合通用对话任务
Qwen2.5系列：完整支持工具调用，适合复杂工作流

完整实现示例

# 初始化智能体系统
model = OpenAIChatCompletionsModel(
    model="qwen2.5:14b-instruct-q5_K_M",
    openai_client=client
)

# 构建专业化智能体
translation_agent = Agent(
    name="翻译专家",
    instructions="专业处理中英互译任务",
    model=model
)

# 运行任务流程
result = Runner.run_sync(
    starting_agent=translation_agent,
    input="请将这段技术文档翻译成英文"
)

高级应用：智能体协作

对于需要多智能体协作的场景，务必选择支持工具调用的模型。以下是一个典型的多语言处理工作流：

路由智能体分析输入语言
自动分发给对应语言专家智能体
聚合处理结果返回

# 构建智能体协作网络
language_router = Agent(
    name="语言路由",
    instructions="根据输入语言分发给对应专家",
    handoffs=[chinese_agent, english_agent],
    model=model
)