FunASR中微调后Paraformer模型的字错率计算方法

2025-05-23 12:59:23作者：秋泉律Samson

在语音识别领域，字错率（Character Error Rate, CER）是评估模型性能的重要指标之一。对于使用FunASR框架微调后的Paraformer实时语音识别模型，计算其字错率需要遵循特定的流程。

FunASR框架提供了完整的计算流程，主要参考aishell/paraformer/run.sh脚本中的stage5部分。该阶段专门负责计算模型的识别性能指标，包括字错率。计算过程通常包含以下几个关键步骤：

准备参考文本：需要准备与测试音频对应的标准文本作为参考（ground truth），这些文本应当经过人工校对确保准确性。
生成识别结果：使用微调后的Paraformer模型对测试集进行推理，得到模型的识别结果文本。
对齐与比较：将识别结果与参考文本进行对齐比较，计算插入（Insertion）、删除（Deletion）和替换（Substitution）的错误数量。
计算CER：基于错误统计结果，按照公式CER = (S + D + I) / N计算字错率，其中S为替换错误数，D为删除错误数，I为插入错误数，N为参考文本总字数。

对于实时语音识别模型，计算CER时还需要注意：

分段处理：实时识别通常是流式的，需要合理划分评估段落
时间对齐：考虑实时识别中的延迟因素
标点处理：根据评估需求决定是否包含标点符号在计算中

FunASR框架内置了完善的评估工具，开发者可以直接调用相关脚本完成这一过程，无需自行实现对齐算法。通过CER指标，开发者可以客观评估模型微调效果，指导后续优化方向。

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统