【亲测免费】 ESP-SR 项目常见问题解决方案

2026-01-29 12:06:00作者：段琳惟

1. 项目基础介绍和主要编程语言

ESP-SR 是由 Espressif Systems 开发的一个开源语音识别框架，旨在帮助用户基于 ESP32-S3 或 ESP32-P4 芯片构建 AI 语音解决方案。该框架包括以下模块：音频前端处理 (Audio Front-end AFE)、唤醒词引擎 (Wake Word Engine)、语音命令词识别、多网络语音合成等。这些模块以组件形式提供，可以轻松集成到用户的项目中。ESP-SR 主要使用 C 语言进行开发，同时也包含了一些 Python 脚本用于配置和测试。

2. 新手在使用这个项目时需要特别注意的3个问题及解决步骤

问题一：如何配置和编译 ESP-SR

问题描述： 新手在使用 ESP-SR 时，可能会对如何配置和编译项目感到困惑。

解决步骤：

确保已经安装了 ESP-IDF，这是 Espressif 的官方开发框架，可以从 Espressif 的官网下载。
克隆 ESP-SR 仓库到本地：git clone https://github.com/espressif/esp-sr.git
进入 ESP-SR 目录，运行 cd esp-sr。
使用 idf.py build 命令来编译项目。

问题二：如何添加自定义的唤醒词

问题描述： 用户可能需要添加自定义的唤醒词，而不是使用预定义的唤醒词。

解决步骤：

在 esp-sr 目录中，找到 components/wake_word_engine/esp_wake_word.h 文件。
在该文件中，找到 wake_word_list 数组，并添加自定义的唤醒词。
重新编译项目。

问题三：如何调试和查看识别结果

问题描述： 在开发过程中，用户可能需要查看和调试语音识别的结果。

解决步骤：

在 components/speech_recognition/speech_recognition.h 文件中，找到相关的日志输出函数，如 ESP_LOGI，并添加适当的日志。
重新编译项目，并在运行时观察终端的输出，以查看识别结果和调试信息。
如果需要更详细的调试信息，可以在编译时开启调试等级，例如使用 make menuconfig 设置 Log Level 为 Debug 或更低的级别。

以上是 ESP-SR 项目的一些常见问题及其解决方案。希望这些信息能帮助新手更好地理解和使用这个开源项目。

esp-sr

Speech recognition

项目地址：https://gitcode.com/gh_mirrors/es/esp-sr

登录后查看全文