Cloud-init项目中GCE平台SSL证书集成测试失败问题分析

2025-06-25 22:33:14作者：柯茵沙

项目地址：https://gitcode.com/gh_mirrors/clo/cloud-init

问题背景

在Cloud-init项目的持续集成测试中，发现一个关于SSL证书安装的集成测试用例（certs_installed）在Google Compute Engine（GCE）平台上运行Ubuntu Noble（24.04）和Oracular（未来版本）时出现失败。该问题自2024年8月2日开始出现，且仅在GCE平台的这两个Ubuntu版本上发生。

问题现象

测试用例TestCaCerts.test_cert_installed验证的是cloud-init是否正确安装了CA证书。测试失败表现为证书校验和不匹配，具体来说：

测试期望的证书校验和与实际系统上的证书文件校验和不一致
该问题仅出现在GCE平台的Ubuntu Noble和Oracular版本上
其他平台和Ubuntu版本不受影响

根本原因分析

经过深入调查，发现问题根源在于Google Guest Agent（GGA）在Ubuntu Noble及后续版本中的行为变化：

GGA自动添加根证书：在Noble及以后版本中，Google Guest Agent会主动发现并添加根证书到系统证书存储中
证书文件变化：/etc/ssl/certs/ca-certificates.crt文件中现在包含两个证书：
- cloud-init安装的证书
- 由GGA添加的第二个证书（13行长度，与/etc/ssl/certs/root.pem匹配）
时间戳证据：/etc/ssl/certs/root.pem的修改时间戳与GGA证书发现的日志记录时间一致

解决方案

基于上述分析，正确的解决方案不是修复证书校验和，而是调整测试逻辑：

测试逻辑调整：测试不应验证整个证书文件的校验和，因为这会受到GGA添加证书的影响
验证方式改进：改为验证cloud-init安装的证书是否确实存在于组合后的/etc/ssl/certs/ca-certificates.crt文件中
更健壮的验证：可以检查目标证书是否作为子集存在于最终的证书文件中，而不是检查整个文件内容