FastEmbed项目：在Docker构建时预下载嵌入模型的最佳实践

2025-07-05 14:23:55作者：卓炯娓

背景介绍

FastEmbed是一个高性能的文本和图像嵌入库，由Qdrant团队维护。在实际生产环境中，很多开发者希望将模型文件预先下载并打包到Docker镜像中，以便在Kubernetes等容器化环境中部署时能够以只读文件系统运行。本文将详细介绍如何实现这一目标。

核心挑战

在容器化部署场景中，开发者面临两个主要挑战：

模型下载时机：需要在构建镜像时而非运行时下载模型
文件系统权限：在Kubernetes等环境中运行时，容器文件系统通常被设置为只读

解决方案

FastEmbed提供了灵活的缓存目录配置选项，可以完美解决上述问题。以下是具体实现方案：

方法一：简单预加载

通过在Dockerfile中添加RUN指令，可以在构建阶段自动下载并缓存模型：

RUN pip install fastembed
RUN python3 -c "from fastembed import TextEmbedding;TextEmbedding(model_name='BAAI/bge-small-en-v1.5')"

这种方法会将模型缓存到默认位置，无需额外配置代码。但需要注意，默认缓存位置可能需要写入权限。

方法二：自定义缓存目录（推荐）

更完善的解决方案是使用cache_dir参数指定自定义缓存目录，并将模型文件预先打包到镜像中：

Python脚本示例 (offline_docker_run.py):

from fastembed import TextEmbedding
from typing import List
import os

# 从环境变量获取缓存目录
FASTEMBED_CACHE_DIR = os.environ.get('FASTEMBED_CACHE_DIR')

documents = [
    "FastEmbed设计为比其他嵌入库更快更轻量",
    "FastEmbed由Qdrant团队支持和维护"
]

# 指定自定义缓存目录
embedding_model = TextEmbedding(cache_dir=FASTEMBED_CACHE_DIR)
embeddings = list(embedding_model.embed(documents))
print(len(embeddings[0]))  # 输出384维向量

Dockerfile配置:

FROM python:3.11-slim

# 定义并传递缓存目录参数
ARG FASTEMBED_CACHE_DIR
ENV FASTEMBED_CACHE_DIR=${FASTEMBED_CACHE_DIR}

# 安装必要依赖
RUN apt-get update && apt-get install -y \
    gcc \
    build-essential \
    && rm -rf /var/lib/apt/lists/*

# 创建缓存目录
RUN mkdir -p ${FASTEMBED_CACHE_DIR}

# 将预下载的模型文件复制到容器中
COPY ${FASTEMBED_CACHE_DIR} /app/${FASTEMBED_CACHE_DIR}

WORKDIR /app
COPY offline_docker_run.py .

RUN pip install fastembed

CMD ["python", "offline_docker_run.py"]

构建和运行命令:

# 构建镜像
docker build --build-arg FASTEMBED_CACHE_DIR=my_cache_dir -t fastembed_offline .

# 以无网络模式运行（确保只读文件系统）
docker run --network none -it fastembed_offline