ArchGW 0.2.0版本发布：增强LLM路由与可观测性能力

2025-06-18 00:23:44作者：邵娇湘

AI-native (edge and LLM) proxy for agents. Engineered with fast ⚡️ LLMs for task (query) routing, rich observability, and the seamless integration of prompts with your APIs for agentic tasks. Built by the contributors of Envoy proxy.

项目地址：https://gitcode.com/gh_mirrors/ar/archgw

ArchGW是一个专注于构建高效API网关的开源项目，特别针对现代云原生架构中的API管理和流量控制需求进行了优化。该项目提供了灵活的插件机制和模块化设计，使开发者能够轻松扩展网关功能，满足各种复杂的业务场景。

核心功能增强

本次发布的0.2.0版本带来了多项重要改进，主要集中在LLM（大语言模型）路由和系统可观测性方面：

Ollama集成优化：修复了与Ollama集成时的令牌计数问题，确保在使用Ollama作为LLM后端时能够准确统计和处理令牌数量。这一改进对于需要精确控制LLM使用成本的场景尤为重要。
自定义LLM支持：新增了对自定义LLM后端的支持，包括SSL安全连接功能。开发者现在可以更安全地将私有部署的LLM模型接入网关系统，同时保持数据传输的安全性。
Honeycomb可观测性集成：为天气预测演示案例添加了Honeycomb支持，并提供了配套的docker-compose文件。这一增强使得开发者能够更方便地实现分布式追踪和系统监控，提升系统可观测性。

开发者体验改进

LLM路由演示脚本：新增了run_demo.sh脚本，专门用于简化LLM路由功能的演示和测试流程。开发者可以更快速地搭建和体验LLM路由功能。
文档完善：根据社区反馈对README文档进行了多次更新和完善，使新用户能够更顺利地开始使用ArchGW项目。

技术实现细节

在架构层面，0.2.0版本继续保持了模块化设计理念：

插件化LLM路由：通过抽象化的路由接口，支持多种LLM后端的无缝切换和组合使用。开发者可以根据需求配置不同的路由策略，如基于成本、性能或功能特性的路由决策。
可观测性栈集成：Honeycomb的集成采用了标准的OpenTelemetry协议，确保与现有监控系统的兼容性。追踪数据包含了完整的请求生命周期信息，便于问题诊断和性能优化。
安全通信层：自定义LLM的SSL支持实现了完整的TLS握手和证书验证机制，确保模型API调用的端到端安全性。

应用场景

新版本特别适合以下应用场景：

多模型混合部署：企业可以同时使用多个LLM提供商的服务，根据请求特性智能路由到最合适的模型。
私有模型安全暴露：通过SSL支持的安全网关，企业可以安全地将内部训练的LLM模型以API形式提供给外部使用。
LLM使用成本监控：精确的令牌计数功能帮助企业更好地控制和优化LLM使用成本。

升级建议

对于现有用户，升级到0.2.0版本时需要注意：

如果使用了Ollama集成，需要验证令牌计数功能是否符合预期。
计划使用Honeycomb追踪的用户，建议先通过提供的docker-compose文件搭建测试环境。
自定义LLM集成的SSL配置需要正确设置证书链和信任库。

ArchGW 0.2.0通过上述改进，进一步巩固了其作为现代API网关解决方案的地位，特别是在AI和LLM应用场景中的优势更加明显。项目团队持续关注开发者反馈并快速响应的态度，也体现了良好的开源项目治理模式。

AI-native (edge and LLM) proxy for agents. Engineered with fast ⚡️ LLMs for task (query) routing, rich observability, and the seamless integration of prompts with your APIs for agentic tasks. Built by the contributors of Envoy proxy.

项目地址：https://gitcode.com/gh_mirrors/ar/archgw

登录后查看全文

最新内容推荐

TJSONObject完整解析教程：Delphi开发者必备的JSON处理指南谷歌浏览器跨域插件Allow-Control-Allow-Origin：前端开发调试必备神器 JDK 8u381 Windows x64 安装包：企业级Java开发环境的完美选择 Windows Server 2016 .NET Framework 3.5 SXS文件下载与安装完整指南 IK分词器elasticsearch-analysis-ik-7.17.16：中文文本分析的最佳解决方案基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器 QT连接阿里云MySQL数据库完整指南：从环境配置到问题解决基于Matlab的等几何分析IGA软件包：工程计算与几何建模的完美融合咖啡豆识别数据集：AI目标检测在咖啡质量控制中的革命性应用 CrystalIndex资源文件管理系统：高效索引与文件管理的最佳实践指南

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统