首页
/ Higress 2.0.5版本发布:AI代理与缓存功能全面升级

Higress 2.0.5版本发布:AI代理与缓存功能全面升级

2025-06-11 19:13:47作者:何举烈Damon

项目简介

Higress是一个基于Envoy构建的高性能云原生网关,由阿里巴巴开源。它提供了丰富的流量管理、安全防护和可观测性能力,特别适合在Kubernetes环境中部署使用。作为Istio生态的重要补充,Higress在AI应用场景中展现了独特的优势。

核心功能升级

1. AI代理功能增强

本次2.0.5版本对AI代理功能进行了多项重要改进:

  • OpenAI嵌入支持:新增了对OpenAI嵌入模型的支持,使开发者能够更方便地集成文本嵌入功能到应用中。
  • 多API版本兼容:针对Minimax提供商,现在支持选择chatCompletionV2或chatCompletionPro API,提供了更大的灵活性。
  • Together AI支持:WASM插件新增对Together AI的支持,扩展了AI服务提供商的选择范围。
  • 统一状态返回:在header阶段返回统一的状态信息,提高了API调用的可预测性。
  • 请求重试机制:增强了失败请求的自动重试能力,并调整了默认重试超时时间,提升了服务可靠性。

2. AI缓存优化

AI缓存功能是本版本的重点优化方向:

  • 静态服务默认端口修复:修正了静态服务的默认端口配置问题。
  • Redis连接优化:支持Redis连接的延迟初始化和数据库选项配置,提高了资源利用率。
  • Cohere嵌入支持:新增对Cohere嵌入模型的支持,丰富了向量化能力。
  • 缓冲区限制调整:更新了body缓冲区的大小限制,以适应更大规模的AI响应数据。

3. 安全与认证改进

  • OIDC插件增强:支持GitHub作为OIDC提供商,并优化了OIDC处理器的配置方式,从全局移至插件配置,提高了灵活性。
  • OPA监听范围:修复了OPA只监听部分IP的问题,现在默认监听所有IP,确保策略评估的全面覆盖。

性能与稳定性提升

  • 流式响应处理:修复了多分块流式响应体的解析问题,确保AI服务返回的流式数据能够被正确处理。
  • 特权端口配置:支持手动设置gateway.unprivilegedPortSupported参数,提供了更灵活的端口管理能力。
  • AI可观测性:全面升级了AI功能的监控和日志记录能力,便于问题排查和性能分析。

开发者体验优化

  • 意图识别增强:AI Intent插件功能得到显著增强,能够更准确地理解用户请求意图。
  • 错误处理改进:优化了AI代理的错误处理流程,提供了更清晰的错误反馈。
  • 文档修正:修复了AI配额文档中的拼写错误,提高了文档质量。

技术实现亮点

Higress 2.0.5版本在技术实现上展现了几个值得关注的创新点:

  1. WASM插件体系:通过WASM插件机制,Higress实现了对多种AI服务提供商的无缝集成,保持了核心网关的轻量级特性。

  2. 混合部署能力:支持特权和非特权端口的灵活配置,使Higress能够适应不同的部署环境和安全要求。

  3. 智能缓存策略:AI缓存功能采用了先进的向量相似度匹配技术,结合Redis的高性能存储,有效降低了重复AI计算的成本。

  4. 可扩展架构:通过模块化设计,Higress能够在不影响核心功能的情况下,持续集成新的AI能力和安全特性。

适用场景

Higress 2.0.5版本特别适合以下应用场景:

  • AI服务网关:作为各类AI模型服务的前置网关,提供统一的API入口、流量控制和缓存加速。
  • 企业级API管理:需要集成多种认证方式和细粒度访问控制的API网关场景。
  • 云原生微服务架构:在Kubernetes环境中作为Ingress Controller,同时提供AI能力增强。
  • 大规模分布式系统:需要高性能流量管理和丰富可观测性能力的复杂系统。

总结

Higress 2.0.5版本标志着该项目在AI网关领域的成熟度进一步提升。通过本次更新,开发者可以获得更稳定、更灵活的AI服务集成能力,同时享受到云原生网关带来的高性能和可扩展性优势。特别是在AI代理和缓存方面的多项改进,使得Higress成为构建AI应用基础设施的理想选择。

登录后查看全文
热门项目推荐

项目优选

收起
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
340
1.2 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
190
267
kernelkernel
deepin linux kernel
C
22
6
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
901
537
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
141
188
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Jupyter Notebook
62
59
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
376
387
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.09 K
0
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
87
4