Harvester CSI驱动在Kubernetes 1.28版本中的权限问题分析
问题背景
在测试Rancher v2.9.6与Harvester v1.3.2的兼容性过程中,发现了一个与存储卷挂载相关的关键问题。具体表现为:当在Kubernetes 1.28版本的RKE2集群中使用Harvester CSI驱动时,Pod无法成功挂载持久化存储卷(PVC),而其他Kubernetes版本(1.27、1.29和1.30)则工作正常。
问题现象
从日志中可以清晰地看到,CSI驱动在尝试访问Longhorn管理的存储卷时遇到了权限拒绝错误。错误信息显示,服务账户"system:serviceaccount:default:rke2-10h41m46s294916-02-20-1"没有权限获取longhorn.io API组中的"volumes"资源。
根本原因分析
深入分析后发现,问题的根源在于Harvester CSI驱动所需的ClusterRole权限配置不完整。当前配置仅包含对storage.k8s.io API组中storageclasses资源的访问权限,而缺少对longhorn.io API组中volumes资源的必要权限。
值得注意的是,这个问题仅在Kubernetes 1.28版本中出现,其他版本工作正常。这表明Rancher在不同Kubernetes版本中可能部署了不同配置的Harvester CSI驱动,或者Kubernetes 1.28版本对RBAC权限检查机制进行了某些调整。
解决方案
解决此问题需要扩展Harvester CSI驱动的ClusterRole权限,增加对Longhorn卷资源的访问权限。完整的ClusterRole配置应包含以下规则:
rules:
- apiGroups: ["storage.k8s.io"]
resources: ["storageclasses"]
verbs: ["get", "list", "watch"]
- apiGroups: ["longhorn.io"]
resources: ["volumes", "volumes/status"]
verbs: ["get", "list"]
注意事项
-
版本兼容性:在Harvester v1.3.2集群上直接修改ClusterRole可能会影响后续升级到v1.4.0的过程,需要谨慎操作。
-
权限最小化:虽然问题可以通过扩大权限解决,但仍应遵循最小权限原则,仅授予必要的权限。
-
版本差异:由于问题仅出现在Kubernetes 1.28版本,建议在混合版本环境中特别注意该版本的配置。
最佳实践建议
对于使用Harvester CSI驱动的生产环境,建议:
- 在部署前全面验证各Kubernetes版本的兼容性
- 建立完善的权限监控机制,及时发现类似的权限不足问题
- 考虑使用准入控制器来确保CSI驱动获得必要的权限
- 在升级Kubernetes版本前,进行充分的兼容性测试
这个问题提醒我们,在云原生生态系统中,各个组件间的权限交互可能会因版本差异而表现出不同的行为,特别是在涉及跨多个项目的集成时,需要更加细致的权限管理和测试验证。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00