Infinity项目中的API路由前缀配置详解

2025-07-04 09:27:18作者：宗隆裙

在部署AI模型服务时，API路由的标准化和一致性对于系统集成和开发体验至关重要。Infinity项目作为一个高效的模型服务框架，提供了灵活的API路由配置选项，使开发者能够轻松实现与OpenAI等标准API的兼容性。

路由前缀的重要性

现代AI服务通常遵循一定的API设计规范，例如OpenAI的标准API路径通常以"/v1"作为前缀。保持API路径的一致性可以带来以下优势：

Infinity项目通过--url-prefix参数（对应环境变量INFINITY_URL_PREFIX）提供了路由前缀的自定义能力。这个参数允许开发者在所有API路由前添加统一的前缀路径。

假设我们需要将模型服务部署在标准路径"/v1"下，可以这样启动服务：

infinity_emb v2 --url-prefix "/v1"

启动后，原本的/embeddings端点将变为/v1/embeddings，与OpenAI API标准保持一致。

除了基本的URL前缀外，Infinity还提供了其他相关的路由配置参数：

Infinity支持同时部署多个模型实例，每个模型可以有自己的服务名称（通过--served-model-name配置）。当使用URL前缀时，这些模型的路由会自动继承前缀配置，形成统一的API路径结构。

例如，部署两个模型并添加"/v1"前缀：

infinity_emb v2 \
  --model-id model1 --served-model-name "text-embedder" \
  --model-id model2 --served-model-name "reranker" \
  --url-prefix "/v1"

这将创建以下API端点：

通过合理利用Infinity的路由配置功能，开发者可以构建出既符合行业标准又易于集成的模型服务API，大大简化了AI能力接入的复杂度。

登录后查看全文