3步突破存储瓶颈：xiaozhi-esp32唤醒词容量扩展指南

2026-03-14 05:16:12作者：傅爽业Veleda

当你尝试为智能设备添加"你好小智"和"小爱同学"等多个唤醒词时，是否遇到过存储空间不足的提示？默认配置下，xiaozhi-esp32的唤醒词分区通常仅分配1MB空间，这在多唤醒词场景下显得捉襟见肘。本文将通过3个核心步骤，帮助你重新规划存储分区，释放设备的语音交互潜力。

问题剖析：默认配置的局限性

在智能家居控制场景中，用户可能需要为不同房间设置专属唤醒词，如"客厅小智"和"卧室小爱"，每个唤醒词模型约需500KB存储空间，默认1MB分区仅能容纳2个模型。而在商业展示场景中，设备需要支持多语言唤醒词切换，例如同时存储中文、英文和日文模型，这至少需要2MB以上的专用空间。当超出默认存储限制时，系统会出现模型加载失败或设备启动异常等问题。

核心原理：存储分区的工作机制

ESP32芯片的存储空间采用分区表进行逻辑划分，就像将一块蛋糕切割成不同功能的区域。默认分区方案将4MB Flash划分为多个功能区块，其中唤醒词模型通常与其他数据共享空间。而自定义分区则通过修改partitions/v1/16m_custom_wakeword.csv文件，专门为唤醒词模型开辟独立的连续存储区域。

分区表采用CSV格式定义，关键字段包括：

Name：分区名称，如"model"表示唤醒词存储区
Type：分区类型，"data"表示数据区，"app"表示应用程序区
Size：分区大小，支持十六进制（0x3f0000）或十进制（6M）表示

通过调整"model"分区的Size参数，即可实现唤醒词存储容量的扩展。这种方式不会影响应用程序运行，因为应用区（ota_0和ota_1）与数据区（model）是相互独立的逻辑空间。

实践步骤：分区扩展全流程

1. 准备分区模板

🔧 选择基础模板 根据设备实际Flash容量选择对应模板文件：

16MB Flash设备：使用partitions/v1/16m_custom_wakeword.csv
32MB Flash设备：使用partitions/v1/32m.csv

🔧 验证模板内容 检查模板中的"model"分区配置：

model,    data, spiffs,  0x10000,   0x3f0000,  # 唤醒词存储区

其中0x3f0000表示4MB空间，满足大多数多唤醒词场景需求。

2. 生成分区资产

🔧 配置构建脚本 确保scripts/spiffs_assets/build_all.py已正确设置模型打包参数：

# 唤醒词模型打包配置
MODEL_CONFIG = {
    "wakenet_model": "models/wakenet_v3.bin",
    "emoji_collection": "assets/emojis",
    "max_size": "4MB"  # 需与分区表中model大小一致
}

🔧 执行构建命令 在项目根目录运行：

python scripts/spiffs_assets/build_all.py --mode emoji_collections

成功执行后，将在scripts/spiffs_assets/build/final目录生成包含唤醒词模型的assets.bin文件。

3. 烧录与验证

🔧 烧录分区表 使用ESP-IDF工具链执行烧录命令：

idf.py -p /dev/ttyUSB0 partition-table-flash

📊 验证存储容量 通过MCP协议发送存储信息查询命令：

{
  "jsonrpc": "2.0",
  "method": "tools/call",
  "params": {
    "name": "system.storage.info",
    "arguments": {}
  },
  "id": 1
}

响应中"model"分区的"total"字段应显示4194304字节（4MB）。

进阶拓展：个性化配置方案

方案A：超大模型支持

对于需要存储8MB唤醒词模型的场景，修改分区表：

model,    data, spiffs,  0x10000,   0x7f0000,  # 8MB唤醒词存储区

同步更新构建脚本中的max_size为"8MB"，适用于需要离线语音识别的专业设备。

方案B：双分区备份

为关键场景设计唤醒词备份分区：

model,    data, spiffs,  0x10000,   0x200000,  # 主唤醒词区(2MB)
model_bak,data, spiffs,  0x210000,  0x200000,  # 备份唤醒词区(2MB)

通过应用层逻辑实现模型自动备份与恢复，提高系统可靠性。

总结与后续学习

通过本文介绍的方法，你已掌握自定义分区扩展唤醒词存储的核心技能。关键文件路径参考：

分区模板目录：partitions/v1/
构建脚本：scripts/spiffs_assets/build_all.py
MCP协议文档：docs/mcp-protocol.md

下一步建议学习唤醒词模型优化技术，通过模型量化将更多唤醒词压缩到有限空间。项目提供的scripts/p3_tools/工具可帮助你转换和优化语音模型，进一步提升设备的语音交互能力。

xiaozhi-esp32

An MCP-based chatbot | 一个基于MCP的聊天机器人

项目地址：https://gitcode.com/GitHub_Trending/xia/xiaozhi-esp32

登录后查看全文