5分钟搞定专业术语识别：FunASR热词优化实战指南

2026-02-05 05:20:33作者：傅爽业Veleda

在医疗、金融等专业领域，通用语音识别系统常将"心肌梗死"误识为"心急梗*死"，把"区块链"拆分成"区块连"。这些错误不仅影响业务效率，更可能导致严重后果。FunASR（Fundamental End-to-End Speech Recognition Toolkit）提供的热词优化功能，通过自定义词汇表将专业术语识别准确率提升至98%以上。本文将从实战角度，教你如何在5分钟内完成热词配置，解决特定领域术语识别难题。

热词优化原理与应用场景

FunASR的热词优化基于WFST（Weighted Finite State Transducer，加权有限状态转换器）技术，通过为特定词汇分配权重来调整识别概率。系统架构中，热词模块位于语音识别核心引擎与语言模型之间，形成"声学模型→热词干预→语言模型→标点断句"的完整处理链路。

核心应用场景包括：

医疗领域：准确识别"心肌梗死"、"冠状动脉粥样硬化"等医学术语
金融场景：正确解析"区块链"、"去中心化金融"等专业词汇
企业内部：定制识别产品名称、项目代号和组织架构术语

官方文档详细说明了热词功能的技术实现：FunASR离线文件转写服务开发指南

快速上手：3步完成热词配置

步骤1：准备热词文件

创建UTF-8编码的文本文件hotwords.txt，每行包含"热词权重"，权重范围1-100（建议专业术语设置60-80）：

心肌梗死 75
冠状动脉粥样硬化 80
区块链 70
去中心化金融 65

权重设置原则：

专业术语：60-80（如"心肌梗死"）
高频常用词：40-60（如"患者"）
普通词汇：10-30（如"检查"）

步骤2：启动带热词的服务

使用Docker快速部署包含热词功能的FunASR服务：

# 拉取最新镜像
sudo docker pull registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.7

# 创建模型缓存目录
mkdir -p ./funasr-runtime-resources/models

# 启动容器并挂载热词文件
sudo docker run -p 10095:10095 -it --privileged=true \
  -v $PWD/funasr-runtime-resources/models:/workspace/models \
  -v $PWD/hotwords.txt:/workspace/models/hotwords.txt \
  registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.7

步骤3：加载热词启动服务

在容器内执行启动命令，通过--hotword参数指定热词文件路径：

cd FunASR/runtime
nohup bash run_server.sh \
  --download-model-dir /workspace/models \
  --vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
  --model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx  \
  --punc-dir damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx \
  --lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \
  --itn-dir thuduj12/fst_itn_zh \
  --hotword /workspace/models/hotwords.txt > log.txt 2>&1 &

服务启动成功后，热词将立即生效。完整部署流程可参考：中文离线文件转写服务部署文档

高级配置：热词优化策略

服务端与客户端热词协同

FunASR支持服务端全局热词与客户端局部热词的协同工作：

服务端热词：通过--hotword参数加载，对所有客户端生效
客户端热词：通过API参数传递，仅对当前请求生效

Python客户端调用示例：

python3 funasr_wss_client.py \
  --host "127.0.0.1" --port 10095 --mode offline \
  --audio_in "../audio/medical_recording.wav" \
  --hotword "./client_hotwords.txt"  # 客户端局部热词

热词权重调优指南

权重设置直接影响识别效果，实践中建议：

专业术语权重60-80，如"区块链 70"
同音异义词权重80-100，如"阿里巴巴 90"
避免所有热词权重相同，形成差异化优先级

热词类型	权重范围	示例
普通专业术语	60-70	区块链 65
高优先级术语	70-80	心肌梗死 75
同音易混淆词	80-100	阿里巴巴 90

热词与语言模型结合

通过Ngram语言模型与热词配合使用，可进一步提升识别准确率：

# 启动命令中添加语言模型参数
--lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst

语言模型训练方法详见官方文档：如何训练LM

效果验证与常见问题

识别效果对比测试

使用相同音频进行热词优化前后的对比测试：

未使用热词：

原始音频："患者确诊为急性心肌梗死，需要进行冠状动脉造影检查"
识别结果："患者确诊为急性心急梗*死，需要进行冠状动漫造影检查"

使用热词后：

原始音频："患者确诊为急性心肌梗死，需要进行冠状动脉造影检查"
识别结果："患者确诊为急性心肌梗死，需要进行冠状动脉造影检查"

常见问题解决方案

热词不生效
- 检查热词文件路径是否正确挂载：docker inspect <container_id>
- 确认服务启动日志：grep hotword log.txt
识别速度变慢
- 热词数量控制在1000个以内
- 降低模型线程数：--model-thread-num 1
权重设置无效
- 确保权重数值在1-100范围内
- 避免特殊字符（仅支持中文、英文、数字和部分符号）