突破小爱音箱音乐壁垒:XiaoMusic开源项目让智能音箱秒变音乐管家
你是否曾因小爱音箱的音乐版权限制而被迫切换播放源?是否想让孩子通过语音指令就能听到喜欢的故事音频?XiaoMusic开源项目正是为解决这些痛点而生——这是一款基于Python开发的小爱音箱增强工具,能让普通智能音箱突破原厂限制,实现本地音乐播放、网络歌曲搜索与自定义语音控制,特别适合追求智能家居体验的音乐爱好者和有孩家庭。
🚀 核心价值:重新定义智能音箱的音乐能力
传统智能音箱受限于商业版权,平均仅能播放约30%的用户想听歌曲。XiaoMusic通过三大创新彻底改变这一现状:
• 全格式兼容:支持MP3/FLAC/WAV/M4A等12种音频格式,比原厂播放器格式支持度提升300%
• 双模式播放:本地音乐库管理+在线资源搜索无缝切换,响应速度比传统方式快2-3秒
• 自定义交互:支持家庭场景化语音指令,如"播放宝宝睡前故事"自动触发特定播放列表
🛠️ 实施路径:5分钟完成从部署到使用的全流程
环境准备(2分钟)
获取项目代码并进入工作目录:
git clone https://gitcode.com/GitHub_Trending/xia/xiaomusic
cd xiaomusic
服务启动(2分钟)
推荐Docker一键部署方案,自动处理依赖安装:
docker run -p 58090:8090 -v /xiaomusic_music:/app/music -v /xiaomusic_conf:/app/conf hanxi/xiaomusic
基础配置(1分钟)
访问http://设备IP:58090完成两项关键设置:
- 输入小米账号完成设备认证
- 在设备列表中选择要控制的小爱音箱型号
🔍 场景拓展:不止于音乐的智能体验
家庭亲子场景
当孩子说"播放小猪佩奇第3集",系统会自动下载对应音频并播放,解决家长手动操作的麻烦。配合定时播放功能,可设置"每天7点播放英语儿歌",让智能音箱成为早教助手。
多设备协同
在拥有多台小爱音箱的家庭中,XiaoMusic支持跨房间同步播放,实现"客厅播放背景音乐+卧室播放白噪音"的分区控制,比原厂多设备管理效率提升60%。
个性化音乐管理
通过Web界面可创建专属歌单,支持M3U格式导入导出。特别适合收藏各类现场Live、播客节目等非标音频内容,构建真正属于自己的音乐库。
🔒 安全与支持:安心使用的技术保障
安全防护建议
• 开启Web界面密码保护(路径:设置 > 安全 > 访问控制)
• 避免在公共网络环境下使用设备发现功能
• 定期通过check_plugins.py脚本更新安全组件
技术支持渠道
项目提供双通道支持:
- 文档中心:docs/index.md
- 社区论坛:通过项目issue系统提交问题,平均响应时间<24小时
社区互动
作为活跃的开源项目,我们期待听到你的声音:
- 你最希望XiaoMusic增加哪些语音控制功能?
- 在多设备家庭中,你如何管理不同房间的音乐播放?
欢迎通过项目贡献指南参与开发,让我们共同打造更强大的智能音箱音乐生态!
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00
ERNIE-ImageERNIE-Image 是由百度 ERNIE-Image 团队开发的开源文本到图像生成模型。它基于单流扩散 Transformer(DiT)构建,并配备了轻量级的提示增强器,可将用户的简短输入扩展为更丰富的结构化描述。凭借仅 80 亿的 DiT 参数,它在开源文本到图像模型中达到了最先进的性能。该模型的设计不仅追求强大的视觉质量,还注重实际生成场景中的可控性,在这些场景中,准确的内容呈现与美观同等重要。特别是,ERNIE-Image 在复杂指令遵循、文本渲染和结构化图像生成方面表现出色,使其非常适合商业海报、漫画、多格布局以及其他需要兼具视觉质量和精确控制的内容创作任务。它还支持广泛的视觉风格,包括写实摄影、设计导向图像以及更多风格化的美学输出。Jinja00

