Rig项目中LLM工具调用消息角色错误问题分析

2025-06-24 22:39:37作者：裴锟轩Denise

问题背景

在Rig项目(一个基于LLM的代理系统)中，发现了一个关于大型语言模型(LLM)工具调用的关键实现错误。当LLM调用外部工具并获取结果后，系统错误地将工具返回结果标记为"user"角色的消息，而非专用的"tool"或"function"角色消息。这一错误导致LLM无法正确识别工具返回结果，进而进入无限循环调用工具的异常状态。

技术细节分析

错误现象

从日志中可以清晰观察到问题现象：

用户发起初始请求
LLM代理正确识别需要调用list_tables_tool工具
工具成功执行并返回结果(包含_sqlx_migrations和users两个表)
但系统将工具结果作为"user"消息加入对话历史
LLM再次识别为需要调用工具，形成无限循环

根本原因

问题的核心在于违反了主流LLM API(包括OpenAI和Qwen等)关于工具调用的规范。正确的工具调用流程应该遵循以下消息序列：

用户消息(user)
助手消息(assistant)包含工具调用请求
工具消息(tool/function)包含工具执行结果
助手消息(assistant)给出最终响应

而当前实现错误地将第3步的工具结果消息标记为了用户消息，导致LLM无法正确理解上下文。

当前错误实现

项目当前的Message枚举定义如下：

#[derive(Clone, Debug, Deserialize, Serialize, PartialEq)]
#[serde(tag = "role", rename_all = "lowercase")]
pub enum Message {
    User { 
        content: OneOrMany<UserContent> 
    },
    Assistant {
        content: OneOrMany<AssistantContent>,
    },
}

工具结果被错误地添加为User消息：

chat_history.push(Message::User { 
    content: OneOrMany::many(tool_content) 
});

解决方案

正确的消息结构设计

需要扩展Message枚举以支持工具角色消息。参考主流实现，建议采用如下结构：

#[derive(Debug, Serialize, Deserialize, PartialEq, Clone)]
#[serde(tag = "role", rename_all = "lowercase")]
pub enum Message {
    User {
        content: String,
        images: Option<Vec<String>>,
        name: Option<String>,
    },
    Assistant {
        content: String,
        images: Option<Vec<String>>,
        name: Option<String>,
        tool_calls: Vec<ToolCall>,
    },
    System {
        content: String,
        images: Option<Vec<String>>,
        name: Option<String>,
    },
    #[serde(rename = "tool")]
    ToolResult {
        tool_call_id: String,
        content: OneOrMany<ToolResultContent>,
    },
}

正确的工具结果添加方式

工具结果应当使用专用角色添加：

chat_history.push(Message::ToolResult {
    tool_call_id: tool_call.id.clone(),
    content: OneOrMany::one(ToolResultContent::from(output)),
});

技术影响分析

这一修复将带来以下改进：

符合规范：与OpenAI和Qwen等主流LLM API的工具调用规范保持一致
避免循环：LLM能正确识别工具结果，不再陷入无限调用循环
可扩展性：为未来支持更复杂的工具调用场景奠定基础
互操作性：更容易与其他LLM系统集成和交互

实现建议

在实际实现时，还需要考虑：

向后兼容性：确保现有代码能处理新的消息类型
错误处理：工具调用失败时的消息处理机制
多工具支持：同时处理多个工具调用的结果
上下文管理：合理控制对话历史长度，避免因工具调用导致上下文膨胀

总结

在基于LLM的系统中，严格遵守消息角色规范对于工具调用的正确性至关重要。Rig项目的这一修复不仅解决了当前的问题，也为系统未来的功能扩展提供了更健壮的基础架构。对于开发者而言，理解LLM交互中的消息角色语义是构建可靠AI应用的关键技能之一。

rig

⚙️🦀 Build modular and scalable LLM Applications in Rust

项目地址：https://gitcode.com/GitHub_Trending/rig2/rig

登录后查看全文