Kubespray项目中使用Ansible Galaxy安装时文件缺失问题分析

2025-05-13 02:36:11作者：乔或婵

在Kubernetes集群部署工具Kubespray的最新版本(v2.26.0)中，用户报告了一个关于Ansible Galaxy安装过程中文件缺失的重要问题。这个问题主要影响了Calico网络插件的API Server功能部署，导致安装过程中出现"Could not find or access 'openssl.conf'"错误。

问题背景

Kubespray作为一个使用Ansible部署Kubernetes集群的工具，其最新版本采用了Ansible Galaxy的manifest机制来管理文件包含。在v2.26.0版本中，项目将galaxy.yml中的文件包含方式从"excludes"改为"manifest"键配置，这一变更意外导致了部分关键文件未被正确包含在最终生成的集合中。

问题根源分析

深入调查发现，问题源于Ansible Galaxy默认的文件包含规则。当使用manifest机制时，系统默认只包含特定扩展名的文件，而忽略了没有扩展名或使用非常见扩展名(如.conf)的文件。具体表现为：

在network_plugins/calico角色的files目录中，openssl.conf文件虽然存在于Git仓库中，但在通过Galaxy安装的集合中缺失
类似问题也影响到了其他关键文件，包括shell脚本和网络配置文件等
这种文件缺失会导致依赖这些文件的部署任务失败

影响范围

经过详细检查，发现以下关键文件受到影响：

网络插件相关文件：macvlan插件的网络接口脚本、Calico的openssl.conf配置文件
系统引导文件：bootstrap.sh等初始化脚本
容器引擎配置：CRI-O的mounts.conf等配置文件
测试相关文件：多个容器引擎的10-mynet.conf测试配置文件

这些文件的缺失可能导致多种功能异常，从网络配置到系统初始化都可能出现问题。

解决方案

针对这一问题，社区提出了两种解决方案思路：

显式包含所有文件：通过修改manifest配置，使用"recursive-include roles **"语句确保所有角色文件都被包含
针对性包含关键目录：使用"recursive-include roles files/*"语句专门包含所有files目录下的内容

第一种方案更为全面但可能包含不必要的文件，第二种方案则更有针对性但需要确保所有关键文件都位于files目录中。

最佳实践建议

对于使用Kubespray部署Kubernetes集群的用户，建议：

在升级到v2.26.0版本前，检查此问题是否已被修复
如果必须使用当前版本，可考虑手动添加缺失文件或从Git仓库直接克隆使用
部署前验证所有必需文件是否存在于集合中
关注社区对此问题的修复进展，及时更新到修复后的版本

对于Ansible角色开发者，这一案例也提醒我们：

在改用manifest机制时，必须全面测试文件包含情况
关键配置文件应使用常见扩展名或放置在特定目录中
CI/CD流程应包含对文件完整性的验证

总结

Kubespray作为企业级Kubernetes部署工具，其稳定性和可靠性至关重要。这次文件缺失问题提醒我们基础设施工具链中微小变更可能带来的广泛影响。通过深入分析问题原因和影响范围，不仅可以帮助用户规避部署风险，也为类似项目的开发提供了宝贵的经验教训。

登录后查看全文

项目优选

收起

deepin linux kernel

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

昇腾LLM分布式训练框架

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。