NVIDIA容器工具包中Apt密钥更新失败问题分析与解决

2025-06-26 18:40:27作者：裘旻烁

问题背景

在使用Ubuntu 20.04.6 LTS系统执行sudo apt-get update -y命令时，用户遇到了一个关于GitHub CLI Apt密钥失效的错误提示。错误信息显示签名无效，具体表现为EXPKEYSIG 23F3D4EA75716059 GitHub CLI的密钥已过期。

系统更新过程中出现了两个关键错误：

用户最初尝试按照GitHub官方提供的解决方案更新密钥，但问题依旧存在。进一步检查发现：

通过curl获取NVIDIA GPG密钥时，TLS握手显示正常，没有过期迹象
密钥文件本身也没有问题，能够正常下载
尝试手动添加NVIDIA的GPG密钥(curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -)并未解决问题

经过深入调查，发现问题实际上与以下因素无关：

真正的原因是系统镜像中的cloud-init配置存在问题。在VM构建过程中，cloud-init自动配置了一个过期的Apt软件源，而这个配置被保留在了系统镜像中。

重建虚拟机：使用最新的cloud-init镜像重新构建虚拟机，这是最彻底的解决方案。
手动修复方案（如果无法立即重建）：
- 检查/etc/apt/sources.list和/etc/apt/sources.list.d/目录下的所有配置文件
- 移除或更新所有指向过期仓库的配置
- 确保使用正确的密钥环路径

系统镜像维护：定期更新基础系统镜像，确保包含最新的软件源配置。
错误诊断方法：
- 不要被表面现象迷惑，需要深入分析错误日志
- 区分直接错误和间接影响
- 考虑系统构建过程中的自动化配置可能引入的问题
密钥管理最佳实践：
- 使用signed-by参数明确指定密钥路径
- 将密钥存储在/etc/apt/keyrings/目录而非传统的/usr/share/keyrings/
- 定期检查密钥有效期并提前更新

Apt密钥验证机制：了解Linux系统如何验证软件包签名，可以帮助更快定位类似问题。
cloud-init的作用：作为云环境初始化工具，它可能在系统构建阶段配置软件源，这些配置可能随着时间推移而过期。
密钥环路径演变：现代Linux发行版倾向于使用/etc/apt/keyrings/而非传统的/usr/share/keyrings/来存储密钥。

通过这次问题排查，我们认识到系统维护中保持基础镜像更新的重要性，以及正确诊断问题根源的关键性。对于生产环境，建议建立定期镜像更新机制，避免类似问题的发生。

登录后查看全文