群晖Docker部署mi-gpt项目实现小爱音箱接入大模型指南

2025-05-21 09:19:00作者：温艾琴Wonderful

项目背景与概述

mi-gpt是一个开源项目，旨在将小米智能音箱接入各类大语言模型(如OpenAI、通义千问、Moonshot等)，从而扩展小爱同学的功能。本文将详细介绍如何在群晖NAS上通过Docker容器化部署mi-gpt项目，实现小爱音箱与AI大模型的对接。

环境准备

在开始部署前，需要确保：

群晖NAS已安装Docker套件
拥有可用的AI大模型API密钥(如OpenAI、通义千问等)
小米账号及密码(用于连接小爱音箱)

部署方案详解

方案一：基础Docker Compose部署

这是最简单的部署方式，适合单个音箱接入场景。创建docker-compose.yml文件，内容如下：

version: '3'
services:
  migpt:
    image: idootop/mi-gpt:latest
    container_name: migpt
    env_file:
      - /volume1/docker/mi-gpt/app/.env
    volumes:
      - /volume1/docker/mi-gpt/app/.migpt.js:/app/.migpt.js
    restart: unless-stopped

关键配置说明：

env_file：指定环境变量文件路径，包含API密钥等敏感信息
volumes：将本地配置文件映射到容器内部
restart：设置容器自动重启策略

方案二：高级多音箱部署

对于需要接入多个音箱的场景，可采用更复杂的部署架构：

mi-gpt/
├── compose.yaml
├── migpt-s12/
│   ├── .env
│   ├── .migpt.js
│   └── tts/
│       └── .env
└── migpt-lx04/
    ├── .env
    ├── .migpt.js
    └── tts/
        └── .env

网络配置技巧：

mi-gpt容器使用host网络模式
TTS服务使用bridge网络模式
通过端口映射实现容器间通信

配置文件详解

.env环境变量文件

# 大模型API配置
OPENAI_API_KEY=sk-xxxxxxxxxxxxxxxx
OPENAI_API_MODEL=gpt-3.5-turbo
# 或使用通义千问
DASHSCOPE_API_KEY=sk-xxxxxxxxxxxxxxxx

# TTS服务配置
TTS_SERVER=http://192.168.31.6:9012
TTS_VOICE=zhiyan_emo

建议选择响应速度快的大模型，如kimi或deepseek-v3，避免复杂推理模型导致响应延迟。

.migpt.js配置文件

{
  "speaker": {
    "userId": "1234**********",
    "password": "********",
    tts: 'custom',
    switchSpeakerKeywords: ["把声音换成"],
    "ttsCommand": [5,1],
    "wakeUpCommand": [5,3],
    "did": "小米AI音箱",
    streamResponse: true,
    debug: true,
    enableTrace: true
  }
}

关键参数说明：

ttsCommand：控制TTS播放的指令
wakeUpCommand：唤醒音箱的指令
streamResponse：启用流式响应，提升交互体验
debug：调试模式，建议初期开启

常见问题解决方案

API密钥未生效问题
- 确保.env文件路径正确
- 检查文件权限设置
- 可在Docker环境变量中直接添加API_KEY作为替代方案
音色切换异常
- 首次请求可能不带音色参数，使用默认音色
- 部分音色名称可能不支持，需测试验证
- 确保TTS服务配置正确
连续对话中断
- 不同型号音箱表现不同，LX04等型号可能存在此问题
- 可尝试调整wakeup参数为[5,2]
- 高端型号如小爱音箱Pro表现更好