Containerd 镜像拉取失败问题分析与解决方案
2025-05-12 21:58:23作者:温玫谨Lighthearted
问题背景
在使用 Containerd 容器运行时拉取镜像时,用户可能会遇到拉取失败的问题,特别是在设置了网络环境变量的情况下。典型的错误表现为连接超时,例如 dial tcp 199.59.148.20:443: i/o timeout,即使通过 curl 命令测试网络连接是正常的。
问题分析
网络设置机制
Containerd 的镜像拉取过程实际上由两个组件共同完成:
- containerd 守护进程:负责管理容器生命周期
- ctr 客户端工具:执行具体的镜像拉取操作
关键点在于,实际的 HTTP/HTTPS 请求是由 ctr 工具发起的,而不是 containerd 守护进程。因此,仅仅为 containerd 设置网络环境变量是不够的。
常见误区
许多用户会通过 systemd 服务文件为 containerd 设置网络:
[Service]
Environment="HTTP_NETWORK=http://network.example.com:8080"
Environment="HTTPS_NETWORK=http://network.example.com:8080"
但这种设置只影响 containerd 守护进程本身,不会影响 ctr 命令的执行环境。
解决方案
正确设置网络的方法
- 为当前会话设置环境变量:
export HTTP_NETWORK=http://network.example.com:8080
export HTTPS_NETWORK=http://network.example.com:8080
ctr images pull docker.io/library/nginx:alpine
- 通过 sudo 保留环境变量:
sudo -E ctr images pull docker.io/library/nginx:alpine
-E 参数会保留当前用户的环境变量。
- 配置系统级环境变量:
在
/etc/environment文件中添加:
HTTP_NETWORK=http://network.example.com:8080
HTTPS_NETWORK=http://network.example.com:8080
NO_NETWORK=localhost,127.0.0.1
网络验证技巧
- 检查实际生效的环境变量:
cat /proc/$(pgrep -f ctr)/environ | tr '\0' '\n' | grep -i network
- 测试网络连接:
curl -v -x http://network.example.com:8080 https://registry-1.docker.io/v2/
高级配置
对于需要长期稳定使用网络的环境,可以考虑以下方案:
- 配置 Containerd 的 registry 镜像:
在
/etc/containerd/config.toml中添加:
[plugins."io.containerd.grpc.v1.cri".registry.mirrors]
[plugins."io.containerd.grpc.v1.cri".registry.mirrors."docker.io"]
endpoint = ["https://registry-1.docker.io"]
- 使用网络自动发现协议: 某些网络环境支持 WPAD 协议,可以配置:
export HTTP_NETWORK=wpad://
export HTTPS_NETWORK=wpad://
常见问题排查
-
网络不支持 HTTPS:
- 现象:HTTP 网站可以访问,HTTPS 失败
- 解决方案:确保网络服务器支持 HTTPS 隧道
-
证书问题:
- 现象:SSL 证书验证失败
- 解决方案:将网络的 CA 证书添加到系统信任链
-
网络认证问题:
- 现象:返回 407 网络认证要求
- 解决方案:在网络地址中包含认证信息:
export HTTPS_NETWORK=http://username:password@network.example.com:8080
总结
Containerd 镜像拉取的网络配置需要注意客户端工具与守护进程的区别。正确的做法是确保执行 ctr 命令的环境中有正确的网络设置。对于生产环境,建议采用系统级的网络配置方案,并结合 registry 镜像设置,以获得稳定可靠的镜像拉取体验。
登录后查看全文
热门项目推荐
相关项目推荐
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
yuanrongopenYuanrong runtime:openYuanrong 多语言运行时提供函数分布式编程,支持 Python、Java、C++ 语言,实现类单机编程高性能分布式运行。Go051
pc-uishopTNT开源商城系统使用java语言开发,基于SpringBoot架构体系构建的一套b2b2c商城,商城是满足集平台自营和多商户入驻于一体的多商户运营服务系统。包含PC 端、手机端(H5\APP\小程序),系统架构以及实现案例中应满足和未来可能出现的业务系统进行对接。Vue00
ebook-to-mindmapepub、pdf 拆书 AI 总结TSX01
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
541
3.77 K
Ascend Extension for PyTorch
Python
351
419
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
889
615
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
338
186
openJiuwen agent-studio提供零码、低码可视化开发和工作流编排,模型、知识库、插件等各资源管理能力
TSX
988
253
openGauss kernel ~ openGauss is an open source relational database management system
C++
169
233
暂无简介
Dart
778
194
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
115
141
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.35 K
759