WhisperX 3.1.6版本中TranscriptionOptions参数问题的分析与解决方案

2025-05-15 06:36:06作者：秋泉律Samson

问题背景

WhisperX作为基于Faster-Whisper的语音识别工具包，在3.1.6版本更新后出现了一个关键参数缺失的问题。当用户尝试加载模型时，系统会抛出"TranscriptionOptions.new() missing 1 required positional argument: 'hotwords'"的错误提示。这个问题源于新版本中引入的参数校验机制，但未正确处理向后兼容性。

技术原理分析

在WhisperX的底层实现中，TranscriptionOptions类负责配置语音识别的各种参数。3.1.6版本对Faster-Whisper的依赖进行了更新，新增了hotwords参数作为必填项。hotwords本意是用于指定需要特别关注的词汇列表，可以提升特定词汇的识别准确率。

当调用whisperx.load_model()函数时，系统会初始化默认的ASR(自动语音识别)选项，其中包括转录参数。新版本中这些参数被传递给TranscriptionOptions构造函数时，如果未显式提供hotwords值，就会触发参数缺失错误。

解决方案

针对这个问题，开发者社区已经提出了修复方案，但在等待官方合并的过程中，用户可以采取以下两种临时解决方案：

显式指定hotwords参数：在调用load_model时，通过asr_options参数明确设置hotwords为None：

asr_options = {
    "hotwords": None
}
model = whisperx.load_model("large-v2", device, compute_type=compute_type, asr_options=asr_options)

回退到3.1.5版本：如果不想修改代码，可以暂时使用3.1.5版本，该版本尚未引入hotwords的强制校验：
```
pip install whisperx==3.1.5
```

深入理解

值得注意的是，不同版本的WhisperX会依赖不同版本的底层Python模块。3.1.5版本和3.1.6+版本在依赖关系上存在差异，这可能导致在某些特殊环境(如Termux等移动端Linux环境)下的兼容性问题。

有用户报告称，较新版本的WhisperX在Termux原生环境(不使用proot)中能够运行，而之前版本则会出现段错误。这表明项目在不断优化跨平台兼容性的同时，也带来了新的参数校验要求。

最佳实践建议

对于生产环境的使用者，建议：

密切关注WhisperX项目的更新动态，及时获取官方修复
在升级版本前，充分测试新版本在目标环境中的表现
考虑使用虚拟环境管理不同项目的依赖关系，避免全局Python环境冲突
对于关键应用，建议锁定特定版本号，避免自动升级带来的意外问题

通过理解这一问题的本质，开发者可以更好地掌握WhisperX的参数配置机制，为未来的使用和问题排查打下坚实基础。

whisperX

WhisperX: Automatic Speech Recognition with Word-level Timestamps (& Diarization)

项目地址：https://gitcode.com/gh_mirrors/wh/whisperX

登录后查看全文

项目优选

收起

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

830

6.18 K

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

AtomGit CLI （ag cli），AtomGit 命令行工具，参考 GitHub CLI (gh) 开发。目前 atomgit-cli 项目已在 AtomCode 的 Coding Plan 项目列表中

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。