Docker Registry垃圾回收机制在多架构镜像场景下的问题分析

2025-05-24 14:02:10作者：薛曦旖Francesca

问题概述

Docker Registry作为容器镜像存储的核心组件，其垃圾回收机制(garbage-collect)在特定场景下存在严重问题。当处理多架构镜像(即包含多个平台架构的manifest)时，执行垃圾回收操作可能导致存储中的有效数据被错误删除，甚至造成整个registry的损坏。

问题表现

在实际操作中，用户发现执行registry garbage-collect命令后，存储空间从445GB骤降至4GB，几乎所有blob数据被清除，仅保留manifest文件。这种异常行为主要出现在以下场景：

使用多架构构建工具(如buildx)推送的镜像
执行标准垃圾回收流程后，再执行带-m参数的垃圾回收命令
多平台架构的OCI manifest特别容易受到影响

技术背景

Docker Registry的垃圾回收机制设计用于清理未被任何manifest引用的blob层，以释放存储空间。在多架构镜像场景下，一个manifest list会引用多个平台特定的manifest，每个平台manifest又引用各自的blob层。这种复杂的引用关系可能导致垃圾回收算法出现误判。

问题根源

经过分析，该问题主要由以下因素导致：

引用计数错误：垃圾回收器在处理多层级manifest引用时，未能正确计算blob的实际引用情况
并发访问问题：在registry运行状态下执行垃圾回收，可能导致数据不一致
版本缺陷：registry 2.8.x版本存在已知的多架构镜像处理缺陷

临时解决方案

对于急需解决存储空间问题的用户，可采用以下临时方案：

手动迁移方案：

#!/bin/bash
# 设置源和目标registry地址
export REGISTRY_SRC="127.0.0.1:5002"
export REGISTRY_DST="127.0.0.1:5000"

# 登录认证
docker login -u="${REGISTRY_USER}" -p="${REGISTRY_PASS}" $REGISTRY_SRC
docker login -u="${REGISTRY_USER}" -p="${REGISTRY_PASS}" $REGISTRY_DST

# 遍历所有仓库和标签进行迁移
repos=$(curl -u "${REGISTRY_USER}:${REGISTRY_PASS}" -k -s -X GET http://$REGISTRY_SRC/v2/_catalog | jq -r '.repositories[]' | sort)
for repo in $repos ; do
    tags=$(curl -u "${REGISTRY_USER}:${REGISTRY_PASS}" -k -s -X GET http://$REGISTRY_SRC/v2/${repo}/tags/list |jq -r '.tags[]')
    for tag in $tags; do
        regctl image copy $REGISTRY_SRC/${repo}:${tag} $REGISTRY_DST/${repo}:${tag}
    done
done