ArchGW 0.3.1版本发布：LLM路由与API网关的智能升级

2025-06-18 05:14:53作者：侯霆垣

AI-native (edge and LLM) proxy for agents. Engineered with fast ⚡️ LLMs for task (query) routing, rich observability, and the seamless integration of prompts with your APIs for agentic tasks. Built by the contributors of Envoy proxy.

项目地址：https://gitcode.com/GitHub_Trending/ar/plano

ArchGW是一个专注于大型语言模型(LLM)路由和API网关管理的开源项目，它通过智能路由机制帮助开发者在多个LLM提供商之间实现最优化的请求分配。最新发布的0.3.1版本带来了一系列重要功能增强和优化，显著提升了系统的灵活性、兼容性和性能表现。

核心功能增强

多模型支持扩展

0.3.1版本新增了对Claude-4模型的支持，进一步丰富了可路由的LLM生态系统。开发者现在可以在路由配置中指定使用Claude-4模型，为不同场景选择最适合的AI能力。同时，项目还引入了"arch"作为新的provider类型，为未来可能的自定义模型集成预留了接口。

智能对话管理优化

针对长对话场景，新版本实现了自动修剪机制。当对话历史超过路由模型的最大处理限制时，系统会自动进行内容压缩，确保请求能够被正确处理。这一改进特别适合需要维护长期对话记忆的应用场景，如客服系统和个性化助手。

性能与兼容性提升

压缩传输支持

新增的压缩/解压缩过滤器显著降低了网络传输负载。对于大模型响应场景，这一功能可以节省带宽使用并提高传输效率，特别适合移动端应用或网络条件受限的环境。

OpenWebUI集成

0.3.1版本特别增加了对OpenWebUI的兼容支持，使得开发者可以更便捷地将ArchGW路由功能集成到现有的Web用户界面中。这一改进降低了接入门槛，让非技术用户也能受益于智能路由带来的优势。

API与路由逻辑改进

模型标识标准化

新版本统一了模型标识处理逻辑，现在/v1/models API会直接使用provider_name作为model_id返回。这一变更简化了客户端处理逻辑，使API响应更加直观和一致。

路由策略分离

项目将货币汇率计算和偏好路由逻辑进行了清晰分离。这种架构上的改进使得系统更加模块化，开发者可以根据需要灵活组合不同的路由策略，或者单独扩展某一部分功能。

文档完善

伴随功能更新，项目文档也进行了相应扩充，特别是LLM路由API部分得到了详细说明。良好的文档支持降低了新用户的学习曲线，帮助开发者更快上手和充分利用系统能力。

0.3.1版本的这些改进共同构成了ArchGW项目发展的重要里程碑，为构建高效、灵活的LLM应用提供了更强大的基础设施支持。无论是需要多模型切换的企业级应用，还是追求成本优化的个人项目，都能从这个版本中获得显著价值。

plano

项目地址：https://gitcode.com/GitHub_Trending/ar/plano

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781