LiteLLM项目中Azure Whisper时间戳粒度参数传递问题解析

2025-05-10 01:31:00作者：魏侃纯Zoe

Python SDK, Proxy Server (AI Gateway) to call 100+ LLM APIs in OpenAI (or native) format, with cost tracking, guardrails, loadbalancing and logging. [Bedrock, Azure, OpenAI, VertexAI, Cohere, Anthropic, Sagemaker, HuggingFace, VLLM, NVIDIA NIM]

项目地址：https://gitcode.com/GitHub_Trending/li/litellm

在语音转文字应用中，时间戳粒度控制是一个重要功能，它决定了返回结果中时间标记的精细程度。本文深入分析LiteLLM项目中Azure Whisper服务时间戳粒度参数传递的技术问题及其解决方案。

问题背景

当开发者通过LiteLLM代理配置Azure Whisper服务时，发现timestamp_granularities参数无法正确传递。具体表现为：

即使指定了timestamp_granularities=['word']参数，返回结果仍然只包含句子级别的时间戳
直接调用Azure OpenAI端点时该参数工作正常
参数验证逻辑失效（如response_format与timestamp_granularities的关联检查）

技术分析

参数传递机制

LiteLLM作为代理层，需要正确处理客户端请求并将其转换为后端服务（如Azure Whisper）的API调用。在这个案例中，表单数据处理环节出现了参数传递问题。

预期行为

正常情况下，当指定timestamp_granularities=['word']且response_format='verbose_json'时，返回结果应包含单词级别的时间戳信息，格式如下：

{
  "words": [
    {
      "end": 0.11999999731779099,
      "start": 0.0,
      "word": "In"
    }
  ]
}

实际行为

由于参数传递问题，实际返回结果仅包含句子级别的分段信息：

{
  "segments": [
    {
      "end": 1.9199999570846558,
      "start": 0.0,
      "text": "In a quaint little village,"
    }
  ]
}

解决方案

该问题已在LiteLLM项目的最新修复中解决，主要涉及表单数据处理逻辑的改进：

确保所有请求参数（包括timestamp_granularities）都能正确传递到后端服务
保持参数验证逻辑的一致性
修复表单数据构建过程中的参数遗漏问题

最佳实践建议

对于需要在LiteLLM中使用Azure Whisper服务的开发者：

确保使用最新版本的LiteLLM
参数组合要符合Azure API规范：
- timestamp_granularities必须与response_format='verbose_json'配合使用
测试时先验证直接调用Azure端点的行为，再通过LiteLLM代理测试

总结

代理层在处理复杂API参数时容易出现传递问题，特别是在处理多层级参数和参数间依赖关系时。LiteLLM项目团队及时修复了这一问题，确保了语音转文字服务中时间戳粒度控制的完整功能可用性。开发者在使用此类高级功能时，应当关注参数间的关联性，并通过对比测试验证功能完整性。

litellm

项目地址：https://gitcode.com/GitHub_Trending/li/litellm

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

468

461

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Python

1.03 K

646

LiteLLM项目中Azure Whisper时间戳粒度参数传递问题解析

问题背景

技术分析

参数传递机制

预期行为

实际行为

解决方案

最佳实践建议

总结

热门内容推荐

最新内容推荐

项目优选

LiteLLM项目中Azure Whisper时间戳粒度参数传递问题解析

问题背景

技术分析

参数传递机制

预期行为

实际行为

解决方案

最佳实践建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选