Higress 2.0.5版本发布：AI代理与缓存功能全面升级

2025-06-11 02:08:08作者：何举烈Damon

Next-generation Cloud Native Gateway | 下一代云原生网关

项目地址：https://gitcode.com/GitHub_Trending/hi/higress

项目简介

Higress是一个基于Envoy构建的高性能云原生网关，由阿里巴巴开源。它提供了丰富的流量管理、安全防护和可观测性能力，特别适合在Kubernetes环境中部署使用。作为Istio生态的重要补充，Higress在AI应用场景中展现了独特的优势。

核心功能升级

1. AI代理功能增强

本次2.0.5版本对AI代理功能进行了多项重要改进：

OpenAI嵌入支持：新增了对OpenAI嵌入模型的支持，使开发者能够更方便地集成文本嵌入功能到应用中。
多API版本兼容：针对Minimax提供商，现在支持选择chatCompletionV2或chatCompletionPro API，提供了更大的灵活性。
Together AI支持：WASM插件新增对Together AI的支持，扩展了AI服务提供商的选择范围。
统一状态返回：在header阶段返回统一的状态信息，提高了API调用的可预测性。
请求重试机制：增强了失败请求的自动重试能力，并调整了默认重试超时时间，提升了服务可靠性。

2. AI缓存优化

AI缓存功能是本版本的重点优化方向：

静态服务默认端口修复：修正了静态服务的默认端口配置问题。
Redis连接优化：支持Redis连接的延迟初始化和数据库选项配置，提高了资源利用率。
Cohere嵌入支持：新增对Cohere嵌入模型的支持，丰富了向量化能力。
缓冲区限制调整：更新了body缓冲区的大小限制，以适应更大规模的AI响应数据。

3. 安全与认证改进

OIDC插件增强：支持GitHub作为OIDC提供商，并优化了OIDC处理器的配置方式，从全局移至插件配置，提高了灵活性。
OPA监听范围：修复了OPA只监听部分IP的问题，现在默认监听所有IP，确保策略评估的全面覆盖。

性能与稳定性提升

流式响应处理：修复了多分块流式响应体的解析问题，确保AI服务返回的流式数据能够被正确处理。
特权端口配置：支持手动设置gateway.unprivilegedPortSupported参数，提供了更灵活的端口管理能力。
AI可观测性：全面升级了AI功能的监控和日志记录能力，便于问题排查和性能分析。

开发者体验优化

意图识别增强：AI Intent插件功能得到显著增强，能够更准确地理解用户请求意图。
错误处理改进：优化了AI代理的错误处理流程，提供了更清晰的错误反馈。
文档修正：修复了AI配额文档中的拼写错误，提高了文档质量。

技术实现亮点

Higress 2.0.5版本在技术实现上展现了几个值得关注的创新点：

WASM插件体系：通过WASM插件机制，Higress实现了对多种AI服务提供商的无缝集成，保持了核心网关的轻量级特性。
混合部署能力：支持特权和非特权端口的灵活配置，使Higress能够适应不同的部署环境和安全要求。
智能缓存策略：AI缓存功能采用了先进的向量相似度匹配技术，结合Redis的高性能存储，有效降低了重复AI计算的成本。
可扩展架构：通过模块化设计，Higress能够在不影响核心功能的情况下，持续集成新的AI能力和安全特性。

适用场景

Higress 2.0.5版本特别适合以下应用场景：

AI服务网关：作为各类AI模型服务的前置网关，提供统一的API入口、流量控制和缓存加速。
企业级API管理：需要集成多种认证方式和细粒度访问控制的API网关场景。
云原生微服务架构：在Kubernetes环境中作为Ingress Controller，同时提供AI能力增强。
大规模分布式系统：需要高性能流量管理和丰富可观测性能力的复杂系统。

总结

Higress 2.0.5版本标志着该项目在AI网关领域的成熟度进一步提升。通过本次更新，开发者可以获得更稳定、更灵活的AI服务集成能力，同时享受到云原生网关带来的高性能和可扩展性优势。特别是在AI代理和缓存方面的多项改进，使得Higress成为构建AI应用基础设施的理想选择。

Next-generation Cloud Native Gateway | 下一代云原生网关

项目地址：https://gitcode.com/GitHub_Trending/hi/higress

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理