ChatGLM3 开放AI流式对话接口中消息处理的优化实践

2025-05-16 11:33:36作者：宗隆裙

在ChatGLM3项目的开放AI API兼容层实现中，消息处理模块存在一个潜在的问题：当使用工具调用功能时，系统指令会被重复添加，且第二次添加时丢失了工具信息。本文将详细分析这一问题，并提出改进方案。

问题背景

ChatGLM3提供了与开放AI API兼容的接口实现，其中process_chatglm_messages函数负责将开放AI格式的消息转换为ChatGLM3内部格式。原始实现中，当存在工具调用时，会先添加一个包含工具信息的系统消息，但在后续处理中又可能再次添加系统消息，导致：

系统指令被重复添加
第二次添加的系统消息丢失了工具信息
虽然不影响功能运行，但逻辑上存在矛盾

技术分析

原始代码的核心逻辑是：

如果存在工具定义(tools)，先添加一个包含工具信息的系统消息
然后遍历所有输入消息进行转换
对于function角色消息转换为observation
对于assistant角色且包含function_call的消息进行特殊处理
其他情况直接添加消息

问题出在第5步：当输入消息中包含system角色消息时，会无条件添加，导致与第一步添加的系统消息重复。

解决方案

改进方案引入了msg_has_sys状态标志：

当添加了带工具的系统消息后，设置msg_has_sys=True
在处理普通消息时，如果遇到system角色且msg_has_sys为True，则跳过该消息
这样可以确保：
- 工具调用场景下，只保留带工具信息的系统消息
- 普通聊天场景下，保留原始的系统消息
- 两种场景都能正确处理

实现效果

改进后的实现能够正确处理两种场景：

工具调用场景：在多轮对话中，只保留最初添加的带工具信息的系统消息，后续的系统消息会被过滤
普通聊天场景：当不存在工具调用时，保留原始的系统消息，确保普通聊天功能正常

技术意义

这一改进虽然看似简单，但体现了API设计中的重要原则：

消息处理的幂等性：确保相同输入产生相同输出
状态管理的清晰性：通过显式状态标志控制流程
场景兼容性：同时支持工具调用和普通聊天两种模式

这种设计模式可以推广到其他类似的消息处理场景中，特别是在需要支持多种对话模式的AI系统中。

总结

通过对ChatGLM3消息处理模块的优化，我们解决了系统消息重复添加的问题，同时保持了功能的完整性和场景的兼容性。这一改进不仅提升了代码的健壮性，也为后续的功能扩展奠定了更好的基础。

ChatGLM3

ChatGLM3 - 由清华大学和智谱AI联合发布的新一代对话预训练模型，具备强大的语言理解和生成能力。

项目地址：https://gitcode.com/gh_mirrors/ch/ChatGLM3

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.26 K

692