xiaozhi-esp32存储扩展完全指南：释放AI语音交互潜能

2026-03-14 02:45:14作者：滕妙奇

痛点解析：唤醒词存储不足的困境

你是否曾遇到这样的情况：精心训练的自定义唤醒词无法全部部署到设备？尝试添加第二个唤醒词时系统提示"存储空间不足"？这是因为默认配置下的存储分区就像一个塞满基础功能的收纳盒，留给唤醒词模型的空间往往只有1MB——仅能容纳3-5个标准唤醒词模型。当你需要实现"小爱同学""你好小智"等多唤醒词切换，或部署更大的语音识别模型时，就必须对存储分区进行重新规划。

原理拆解：存储分区的工作机制

存储分区就像智能设备的"收纳系统"，每个分区都有特定的功能定位。在xiaozhi-esp32项目中，分区表（CSV格式）定义了不同功能模块的存储空间分配，其中关键的"model"分区专门用于存放唤醒词模型。

图：MCP协议架构展示了存储扩展后设备与云端的交互能力增强

默认的4MB配置中，唤醒词分区仅占1MB空间，而通过16m_custom_wakeword.csv模板配置，可将唤醒词存储空间扩展至4MB，相当于能容纳约20个标准唤醒词模型。分区表中的每个条目包含名称、类型、子类型、起始偏移和大小等关键信息，共同构成设备的存储蓝图。

实战部署：四步完成存储扩展

1. 准备工作与模板选择

⚠️ 注意：修改分区前需备份设备数据，防止配置过程中数据丢失。

根据你的设备Flash容量选择合适的分区模板：

配置文件	总容量	唤醒词分区	可容纳唤醒词数量	适用场景
4m.csv	4MB	1MB	3-5个	基础功能验证
8m.csv	8MB	2MB	10-12个	中等规模应用
16m_custom_wakeword.csv	16MB	4MB	18-20个	多唤醒词场景
32m.csv	32MB	8MB	40+个	专业开发与测试

模板文件位于项目的partitions/v1/目录下，其中16m_custom_wakeword.csv是专为唤醒词扩展优化的配置。

2. 自定义分区配置（可选）

如果你需要特殊的存储分配，可以复制现有模板进行修改。关键是调整"model"分区的Size值：

model,    data, spiffs,  0x10000,   0x7f0000,  # 8MB唤醒词存储区

这里的0x7f0000表示十六进制的存储大小，转换为十进制约为8MB。修改时需注意保持各分区的偏移量不重叠，确保总容量不超过设备实际Flash大小。

3. 生成分区与资产文件

项目提供了图形化和命令行两种方式来生成分区文件：

图形化工具（推荐新手）：运行scripts/spiffs_assets/build_all.py脚本，通过可视化界面选择"emoji_collections"模式，工具会自动根据选中的分区模板生成所需文件。

命令行方式（适合高级用户）：

python scripts/spiffs_assets/build_all.py --mode emoji_collections

生成的assets.bin文件位于scripts/spiffs_assets/build/final目录，包含了优化后的唤醒词模型和资源文件。

4. 烧录分区表

使用ESP-IDF工具链将新的分区表烧录到设备：

idf.py -p /dev/ttyUSB0 partition-table-flash

⚠️ 注意：确保设备已正确连接，端口号（如/dev/ttyUSB0）需根据实际情况调整。烧录过程中不要断开设备连接，以免造成系统损坏。

验证优化：确保存储扩展成功

烧录完成后，可通过MCP协议的system.storage.info命令验证存储配置：

{
  "jsonrpc": "2.0",
  "method": "tools/call",
  "params": {
    "name": "system.storage.info",
    "arguments": {}
  },
  "id": 1
}

成功扩展后，你将看到model分区大小变为预期值（如4MB或8MB）。此时可通过MCP工具上传多个唤醒词模型，测试设备在多唤醒词场景下的响应能力。

常见问题排查

问题1：烧录后设备无法启动

解决方案：检查分区表中各分区的偏移量和大小是否正确，确保没有重叠。建议使用官方提供的模板文件，避免手动计算偏移量。

问题2：唤醒词识别准确率下降

解决方案：扩展存储后需重新上传唤醒词模型，确保模型文件完整。可通过scripts/p3_tools/目录下的工具验证模型文件完整性。

问题3：分区大小显示不正确

解决方案：确认使用了正确的分区模板，ESP-IDF工具链版本需匹配项目要求。可运行idf.py --version检查工具链版本。

问题4：生成assets.bin文件失败

解决方案：检查Python环境是否安装了必要依赖，运行pip install -r scripts/spiffs_assets/requirements.txt安装依赖包。

进阶应用场景

扩展存储容量后，你可以探索更多高级应用：

多唤醒词场景切换：为家庭不同成员设置专属唤醒词，实现个性化交互体验
场景化语音模型：针对不同场景（如厨房、卧室、办公室）部署优化的语音识别模型
离线语音命令库：存储数百条离线语音命令，实现无网络环境下的本地控制
语音交互日志：保存语音交互历史，用于优化唤醒词和命令识别准确率
模型热切换：通过MCP协议动态切换不同领域的专业唤醒词模型

通过合理规划存储分区，xiaozhi-esp32设备将获得更强大的语音交互能力，为构建个性化AI助手奠定坚实基础。项目的docs/mcp-usage.md文档提供了更多关于MCP协议的高级应用指南，帮助你充分利用扩展后的存储资源。

xiaozhi-esp32

An MCP-based chatbot | 一个基于MCP的聊天机器人

项目地址：https://gitcode.com/GitHub_Trending/xia/xiaozhi-esp32

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

471

473

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.04 K

272