最完整MiGPT安装指南:3步激活AI音箱
2026-02-04 04:13:21作者:侯霆垣
你还在为小爱音箱的“智能体验不佳”而烦恼吗?想让家里的智能设备秒变贴心AI助手?本文将通过3个核心步骤,手把手教你将小爱音箱接入ChatGPT和豆包大模型,从环境准备到语音交互全流程覆盖,让你的智能音箱真正实现“能听会说”。
读完本文你将获得:
- 精准匹配的设备选型方案
- 两种部署模式(Docker/Node.js)的详细操作指南
- 避坑指南与常见故障解决方案
- 优化语音交互体验的高级配置技巧
一、环境准备:设备与依赖检查
1.1 兼容设备清单
MiGPT支持大部分小爱音箱型号,但不同设备的功能支持度存在差异。以下是经过验证的设备列表:
| 支持等级 | 设备名称 | 型号 | 连续对话 | 核心指令配置 |
|---|---|---|---|---|
| ✅ 完美运行 | 小爱音箱Pro | LX06 | 支持 | tts:[5,1],wake:[5,3] |
| ✅ 完美运行 | 小米AI音箱第二代 | L15A | 支持 | tts:[7,3],wake:[7,1] |
| ✅ 完美运行 | 小爱智能家庭屏10 | X10A | 支持 | tts:[7,3],wake:[7,1] |
| 🚗 正常运行 | 小爱音箱Play增强版 | L05C | 不支持 | tts:[5,3],wake:[5,1] |
| 🚗 正常运行 | 小爱触屏音箱 | LX04 | 不支持 | tts:[5,1],wake:[5,2] |
| ❌ 不支持 | 小米小爱音箱HD | SM4 | - | - |
型号查询方法:在米家APP中查看设备详情,或访问MIoT设备数据库搜索设备型号
1.2 系统环境要求
| 部署方式 | 最低配置要求 | 推荐配置 |
|---|---|---|
| Docker | 2GB内存,10GB存储空间 | 4GB内存,20GB SSD |
| Node.js | Node.js 16+,npm/pnpm 7+ | Node.js 20+,pnpm 9+ |
二、部署实施:两种安装方案
方案A:Docker一键部署(推荐新手)
步骤1:安装Docker环境
# Ubuntu/Debian系统
sudo apt-get update && sudo apt-get install docker-ce docker-ce-cli containerd.io -y
# 验证安装
docker --version # 应输出Docker version 20.10+
步骤2:获取配置文件
# 克隆仓库
git clone https://gitcode.com/GitHub_Trending/mi/mi-gpt
cd mi-gpt
# 复制配置文件模板
cp .migpt.example.js .migpt.js
cp .env.example .env
步骤3:配置核心参数
编辑.migpt.js文件,设置小米账号和设备信息:
module.exports = {
speaker: {
userId: "987654321", // 小米ID(在account.xiaomi.com查看)
password: "your_password", // 小米账号密码
did: "小爱音箱Pro", // 音箱在米家APP中的名称
ttsCommand: [5, 1], // 根据设备型号选择(参考1.1节表格)
wakeUpCommand: [5, 3] // 根据设备型号选择
},
// 其他参数保持默认
}
编辑.env文件配置AI服务:
# OpenAI配置(二选一)
OPENAI_API_KEY=sk-xxxxxxxxxxxxxxxxxxxx
OPENAI_MODEL=gpt-4o
# 或豆包配置(二选一)
DOUBAO_API_KEY=your_doubao_api_key
DOUBAO_MODEL=ERNIE-Bot-4
步骤4:启动服务
# 构建并启动容器
docker run -d --env-file $(pwd)/.env -v $(pwd)/.migpt.js:/app/.migpt.js idootop/mi-gpt:latest
# 查看运行状态
docker ps | grep mi-gpt # 应显示running状态
方案B:Node.js源码部署(开发者首选)
步骤1:安装依赖环境
# 安装Node.js(以Ubuntu为例)
curl -fsSL https://deb.nodesource.com/setup_20.x | sudo -E bash -
sudo apt-get install -y nodejs
# 验证版本
node -v # 应输出v20.14.0+
pnpm -v # 应输出9.1.1+
步骤2:获取源码并安装依赖
git clone https://gitcode.com/GitHub_Trending/mi/mi-gpt
cd mi-gpt
pnpm install # 安装项目依赖
pnpm db:gen # 初始化数据库
步骤3:配置与启动
# 同方案A步骤3配置.migpt.js和.env文件
# 开发模式启动
pnpm dev
# 或生产模式启动
pnpm build
pnpm start
三、激活与验证:3分钟完成交互测试
3.1 基础功能验证
成功启动服务后,进行以下测试:
- 语音唤醒:对着音箱说“小爱同学,召唤AI助手”
- 基础问答:提问“今天北京天气如何”,应听到AI语音回复
- 角色扮演:说“你现在是数学老师,解释什么是勾股定理”
3.2 高级配置优化
记忆功能开启
修改.migpt.js启用长短期记忆:
memory: {
enable: true,
longTerm: {
maxTokens: 2000 // 长期记忆上下文长度
},
shortTerm: {
duration: 300 // 短期记忆保留时间(秒)
}
}
自定义TTS语音
配置豆包同款音色(需申请百度API):
speaker: {
tts: "baidu",
ttsConfig: {
appId: "your_appid",
apiKey: "your_apikey",
secretKey: "your_secretkey",
voice: "duxiaoyao" // 豆包音色
}
}
3.3 故障排查指南
| 常见问题 | 解决方案 |
|---|---|
| 设备连接失败 | 1. 检查小米账号是否开启两步验证 2. 确认音箱已在米家APP中正常联网 3. 尝试重启音箱后重新运行 |
| AI无响应 | 1. 检查API密钥是否有效 2. 验证网络连通性( ping api.openai.com)3. 查看日志: docker logs [container_id] |
| 语音断断续续 | 1. 关闭流式响应:streamResponse: false2. 调整网络带宽,确保上行≥2Mbps |
四、总结与进阶
通过本文3个步骤,你已成功将传统小爱音箱升级为AI语音助手。MiGPT不仅支持基础问答,还可通过配置实现智能家居控制、日程管理等高级功能。建议后续关注:
提示:定期执行
git pull更新代码,或通过Docker命令docker pull idootop/mi-gpt:latest获取最新镜像,以获得更好的兼容性和功能体验。
如果觉得本指南对你有帮助,请点赞收藏,并关注获取更多智能家居AI改造技巧!下期我们将揭秘MiGPT的工作原理,教你深度定制AI交互逻辑。
登录后查看全文
热门项目推荐
相关项目推荐
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin07
compass-metrics-modelMetrics model project for the OSS CompassPython00
最新内容推荐
终极Emoji表情配置指南:从config.yaml到一键部署全流程如何用Aider AI助手快速开发游戏:从Pong到2048的完整指南从崩溃到重生:Anki参数重置功能深度优化方案 RuoYi-Cloud-Plus 微服务通用权限管理系统技术文档 GoldenLayout 布局配置完全指南 Tencent Cloud IM Server SDK Java 技术文档 解决JumpServer v4.10.1版本Windows发布机部署失败问题 最完整2025版!SeedVR2模型家族(3B/7B)选型与性能优化指南2025微信机器人新范式:从消息自动回复到智能助理的进化之路3分钟搞定!团子翻译器接入Gemini模型超详细指南
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
525
3.72 K
Ascend Extension for PyTorch
Python
329
392
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
878
582
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
336
164
暂无简介
Dart
765
189
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
12
1
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.33 K
746
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
67
20
React Native鸿蒙化仓库
JavaScript
302
350