Kong AI-Proxy插件在3.9.0版本中的流式响应问题分析

2025-05-02 20:30:16作者：咎岭娴Homer

🦍 The Cloud-Native API Gateway and AI Gateway.

项目地址：https://gitcode.com/gh_mirrors/kon/kong

Kong作为一款开源的API网关，在其3.9.0版本中引入了一个值得注意的行为变更：当使用AI-Proxy插件处理流式响应时，会出现响应缓冲现象，这与3.8.0版本的工作方式形成鲜明对比。

问题现象

在Kong 3.9.0版本中，当客户端请求AI服务（如某AI平台）的流式响应时，Kong会将所有服务器发送事件(SSE)缓冲到临时文件中，直到整个响应完成才返回给客户端。这一行为通过Nginx警告日志可见："an upstream response is buffered to a temporary file"。相比之下，3.8.0版本能够正确地将每个SSE事件实时转发给客户端。

技术背景

Kong的AI-Proxy插件设计用于简化与各种AI服务提供商的集成。在流式API调用场景中，客户端通常会设置stream: true参数，期望服务器以分块传输编码(Chunked Transfer Encoding)方式逐步返回响应。这种机制对于大语言模型(LLM)交互尤为重要，因为它允许用户实时看到生成结果，而不是等待整个响应完成。

问题复现与验证

通过Docker环境可以清晰复现这一问题：

使用Kong 3.8.0时，向某AI平台的聊天接口发送流式请求，SSE事件能够实时传输
升级到3.9.0后，相同配置下响应会被缓冲
绕过AI-Proxy插件直接调用时，流式功能恢复正常

这一现象不仅限于某AI平台，在AWS Bedrock和自托管服务等多种AI提供商环境中均有出现，表明问题具有普遍性。

影响分析

响应缓冲行为会导致两个主要问题：

用户体验下降：客户端无法实时获取生成内容
内存压力增加：大响应可能被完整缓冲到内存或磁盘

解决方案

该问题已在后续版本中得到修复。对于必须使用3.9.0版本的用户，可以考虑以下临时解决方案：

调整Nginx缓冲区设置
暂时降级到3.8.0版本
对于关键业务流，考虑绕过AI-Proxy插件

总结

这个案例展示了API网关在版本升级过程中可能出现的不兼容行为变更。对于依赖流式响应的AI应用，建议在升级前充分测试，并关注官方修复动态。同时，这也提醒开发者需要仔细评估中间件对特殊协议（如SSE）的支持情况。

🦍 The Cloud-Native API Gateway and AI Gateway.

项目地址：https://gitcode.com/gh_mirrors/kon/kong

登录后查看全文

最新内容推荐

Solidcam后处理文件下载与使用完全指南：提升CNC编程效率的必备资源基于Matlab的等几何分析IGA软件包：工程计算与几何建模的完美融合开源电子设计自动化利器：KiCad EDA全方位使用指南深入解析Windows内核模式驱动管理器：系统驱动管理的终极利器基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器 OMNeT++中文使用手册：网络仿真的终极指南与实用教程咖啡豆识别数据集：AI目标检测在咖啡质量控制中的革命性应用瀚高迁移工具migration-4.1.4：企业级数据库迁移的智能解决方案昆仑通态MCGS与台达VFD-M变频器通讯程序详解：工业自动化控制完美解决方案 Python开发者的macOS终极指南：VSCode安装配置全攻略

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

ohos_react_native

React Native鸿蒙化仓库