One API 项目中 Azure OpenAI 模型版本映射机制解析

2025-07-06 19:58:38作者：何举烈Damon

OpenAI 接口管理 & 分发系统，支持 Azure、Anthropic Claude、Google PaLM 2、智谱 ChatGLM、百度文心一言、讯飞星火认知、阿里通义千问以及 360 智脑，可用于二次分发管理 key，仅单可执行文件，已打包好 Docker 镜像，一键部署，开箱即用

项目地址：https://gitcode.com/gh_mirrors/one/one-api

在 One API 项目中，开发者发现当使用 Azure OpenAI 服务时，如果测速模型设置为 gpt-3.5-turbo-1106 或 gpt-35-turbo-1106 会出现报错。这实际上反映了项目中对 Azure OpenAI 模型版本号处理的一个设计决策。

问题背景

One API 在处理 Azure OpenAI 请求时，对模型名称进行了特殊处理：当模型名称以四位数字结尾时，系统会自动去除这些数字。例如，gpt-3.5-turbo-1106 会被转换为 gpt-3.5-turbo 进行请求。这一设计源于 Azure OpenAI 早期的限制——每个模型只能部署一次实例。

设计初衷

这种处理方式的主要目的是简化模型管理。在 Azure OpenAI Studio 中，管理员可以通过更改部署版本来控制所有 gpt-3.5-turbo-xxx 变体指向同一个基础模型 gpt-3.5-turbo。这种设计避免了为每个模型版本创建单独的映射关系，降低了配置复杂度。

潜在问题

然而，这种自动去除版本号的做法也带来了一些潜在问题：

功能差异：不同版本的模型（如 gpt-3.5-turbo-1106 和 gpt-3.5-turbo）可能在最大 token 数等关键参数上存在差异。自动去除版本号可能导致应用程序无法针对特定版本进行优化。
日志和计费混淆：所有请求在日志和计费系统中都会显示为基本模型名称，难以区分实际使用的具体版本。
功能限制：某些应用程序可能需要精确控制使用的模型版本，自动转换会破坏这种精确控制。

解决方案探讨

针对这些问题，项目维护者提出了几个可能的改进方向：

恢复显式映射：为每个模型版本创建明确的映射关系，保留完整的版本信息。
请求时替换：在向供应商 API 发送请求时才进行模型名称替换，保持日志和计费中显示用户实际请求的模型名称。
配置选项：提供配置开关，让用户自行决定是否启用版本号自动去除功能。

临时解决方案

对于急需解决问题的用户，目前有两种临时解决方案：

修改代码：可以 fork 项目代码，移除自动去除版本号的逻辑后重新编译。
调整模型名称：在 Azure 中将模型名称改为非四位数字后缀的形式，避开自动处理逻辑。

未来展望

这一问题的讨论反映了 API 网关类项目在处理不同云服务商时的兼容性挑战。理想情况下，系统应该既能保持配置的简洁性，又能提供足够的灵活性来满足不同使用场景的需求。随着 Azure OpenAI 服务的演进，One API 项目很可能会引入更精细的模型版本控制机制，为用户提供更好的使用体验。

OpenAI 接口管理 & 分发系统，支持 Azure、Anthropic Claude、Google PaLM 2、智谱 ChatGLM、百度文心一言、讯飞星火认知、阿里通义千问以及 360 智脑，可用于二次分发管理 key，仅单可执行文件，已打包好 Docker 镜像，一键部署，开箱即用

项目地址：https://gitcode.com/gh_mirrors/one/one-api

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理