Whisper ASR Webservice 中 Faster Whisper 引擎的 JSON 序列化问题解析

2025-06-30 11:21:42作者：裴锟轩Denise

whisper-asr-webservice

OpenAI Whisper ASR Webservice API

项目地址：https://gitcode.com/gh_mirrors/wh/whisper-asr-webservice

问题背景

在语音识别领域，Whisper ASR Webservice 是一个基于 OpenAI Whisper 模型的 Web 服务封装。该项目支持多种 Whisper 实现，包括原生的 Whisper 和 Faster Whisper 优化版本。在 v1.7.0 版本中，用户报告了一个关于 Faster Whisper 引擎输出 JSON 格式时出现的序列化问题。

技术细节

当用户将输出格式设置为 JSON 并使用 Faster Whisper 作为 ASR 引擎时，系统会抛出 TypeError 异常，提示 Segments 对象不可序列化。这是因为 Faster Whisper 在 v1.7.0 版本中修改了其响应对象的结构，导致原有的 JSON 序列化方法不再适用。

解决方案分析

社区用户提供了一个有效的解决方案：通过自定义 JSON 编码器来处理数据类对象。具体实现如下：

class JSONEncoder(json.JSONEncoder):
    def default(s, o):
        if dataclasses.is_dataclass(o):
            return dataclasses.asdict(o)
        return super().default(o)

class WriteJSON(ResultWriter):
    extension: str = "json"

    def write_result(self, result: dict, file: TextIO):
        json.dump(result, file, cls=JSONEncoder)

这种方法利用了 Python 的 dataclasses 模块，将数据类对象转换为字典后再进行序列化。相比 v1.6.0 版本中直接将数组索引值序列化的方式，新方法生成的 JSON 结构更加清晰，包含了字段名称（如 start、end、tokens 等），提高了可读性和易用性。

影响与考量

这种修改虽然解决了序列化问题，但也带来了输出格式的变化。开发者需要注意：

向后兼容性问题：新格式与旧版本不兼容，可能需要更新依赖此输出的下游代码
数据结构变化：从数组形式变为带有命名字段的对象，提高了数据结构的自描述性
性能影响：额外的数据类转换可能会引入轻微的性能开销

最佳实践建议

对于使用 Whisper ASR Webservice 的开发者，建议：

如果使用 Faster Whisper 引擎并需要 JSON 输出，可以采用上述自定义编码器方案
在升级版本时，注意检查输出格式的变化，必要时调整解析逻辑
考虑在项目文档中明确说明不同引擎的输出格式差异

总结

这个问题的出现反映了开源项目中依赖项更新带来的兼容性挑战。通过自定义 JSON 编码器，开发者可以灵活处理数据类对象的序列化需求，同时也展示了 Python 生态系统中 dataclasses 模块的强大功能。对于语音识别应用的开发者来说，理解这些底层技术细节有助于更好地构建稳定可靠的应用系统。

whisper-asr-webservice

OpenAI Whisper ASR Webservice API

项目地址：https://gitcode.com/gh_mirrors/wh/whisper-asr-webservice

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。