MiGPT项目支持的小爱音箱型号技术解析
2025-05-21 05:17:22作者:伍希望
项目背景
MiGPT是一个开源项目,旨在为小米生态链中的小爱音箱设备提供智能对话功能扩展。该项目通过对接小爱音箱的MIoT协议接口,实现了对多种型号小爱音箱的支持,并提供了连续对话等增强功能。
设备兼容性分析
完美支持的设备型号
经过社区验证,以下小爱音箱型号能够完美运行MiGPT项目,包括支持连续对话功能:
-
Xiaomi智能音箱Pro (型号OH2P)
- 控制指令:ttsCommand[7,3]、wakeUpCommand[7,1]
- 特点:支持流式响应,可实现连续对话
-
小爱音箱Pro (型号LX06)
- 控制指令:ttsCommand[5,1]、wakeUpCommand[5,3]
- 特点:响应速度快,对话流畅
-
小米AI音箱 (型号S12)
- 控制指令:ttsCommand[5,1]、wakeUpCommand[5,3]
- 特点:基础型号但功能完整
-
小米AI音箱(第二代) (型号L15A)
- 控制指令:ttsCommand[7,3]、wakeUpCommand[7,1]
- 特点:新增playingCommand[3,1,1]状态检测
-
小爱音箱万能遥控版 (型号LX5A)
- 控制指令:ttsCommand[5,1]、wakeUpCommand[5,3]
- 特点:支持红外遥控的同时保持对话功能
基本支持的设备型号
以下设备可以运行MiGPT基本功能,但由于硬件或固件限制,不支持连续对话:
-
小爱音箱mini (型号LX01)
- 控制指令:ttsCommand[5,1]、wakeUpCommand[5,2]
- 限制:无法检测播放状态
-
小爱音箱Play增强版 (型号L05C)
- 控制指令:ttsCommand[5,3]、wakeUpCommand[5,1]
- 限制:MIoT接口查询异常
-
小爱触屏音箱 (型号LX04)
- 控制指令:ttsCommand[5,1]、wakeUpCommand[5,2]
- 限制:触屏操作与语音功能存在冲突
不支持的设备型号
以下设备由于硬件架构或协议差异,目前无法兼容MiGPT项目:
- 小米小爱音箱HD (型号SM4)
- 小米小爱蓝牙音箱随身版
技术实现要点
-
控制指令解析:
- 不同型号使用不同的siid/piid组合控制语音功能
- ttsCommand控制文本转语音输出
- wakeUpCommand控制设备唤醒状态
-
状态检测机制:
- playingCommand用于检测设备是否正在播放音频
- 这是实现连续对话的关键技术点
-
流式响应实现:
- streamResponse参数控制是否启用连续对话
- 需要设备支持状态查询和中断机制
使用建议
- 对于支持连续对话的设备,建议保持streamResponse=true以获得最佳体验
- 基本支持的设备应将streamResponse设为false以避免功能异常
- 遇到设备识别问题时,可通过调试模式获取真实设备ID
- 退出关键词设置应考虑避开系统保留指令(如"暂停"、"音量"等)
未来展望
随着项目发展,预计将会有更多型号的小爱音箱获得支持。社区正在探索自动指令匹配机制,以简化配置过程。对于新型号的支持,需要更多用户反馈和测试数据。
通过MiGPT项目,用户可以在官方功能基础上,为小爱音箱扩展更智能的对话能力,创造更丰富的智能家居体验。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0191
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0118
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
fun-rec推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/Python03
so-large-lm大模型基础: 一文了解大模型基础知识01
项目优选
收起
暂无描述
Dockerfile
764
4.98 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
857
1.93 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
683
1.33 K
Ascend Extension for PyTorch
Python
719
882
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.08 K
1.1 K
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
457
439
用户可使用该项目在 OpenHarmony 平台开发应用,支持通过 IDE 或终端用 Flutter Tools 指令编译构建,基于 Flutter 3.27.4 版本,新增 impeller-vulkan 渲染模式,兼容多种开发指令与环境配置。
Dart
1.01 K
261
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
151
253
CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。
Python
998
609