Argo Rollouts 集群角色权限缺失问题分析与解决方案

2025-07-06 09:35:35作者：庞队千Virginia

问题背景

在使用 Argo Rollouts 进行应用部署迁移时，发现其最新引入的 scaleDown 功能无法正常工作。该功能是 Argo Rollouts v1.7.0 版本引入的一项重要特性，主要用于在迁移过程中引用现有 Deployment 资源时控制其缩容行为。

问题现象

当用户尝试在 Rollout 资源中通过 workloadRef 引用现有 Deployment 并设置 scaleDown: onsuccess 参数时，Argo Rollouts 控制器会报出权限错误，提示服务账号 argo-rollouts 没有更新 apps/v1 API 组下 deployments 资源的权限。

根本原因分析

经过深入分析，发现问题的根源在于 Argo Rollouts 的 Helm Chart 中定义的集群角色(ClusterRole)缺少必要的权限配置。具体来说，控制器需要对引用的 Deployment 资源执行更新操作以实现 scaleDown 功能，但当前的集群角色配置中仅包含了 get 和 list 权限，缺少关键的 update 权限。

技术细节

在 Kubernetes 的 RBAC 授权模型中，当控制器需要修改某个资源时，必须显式声明相应的操作权限。Argo Rollouts 控制器在实现 scaleDown 功能时，实际上需要执行以下操作序列：

获取引用的 Deployment 资源状态
根据 Rollout 策略更新 Deployment 的副本数
监控 Deployment 的变更状态

其中第二步需要 update 权限，而当前配置仅提供了读取权限。

解决方案演进

临时解决方案

在等待官方修复期间，用户可以通过 Helm Chart 的 providerRBAC.additionalRules 配置项添加额外的权限规则。具体配置如下：

providerRBAC:
  additionalRules:
    - apiGroups: ["apps"]
      resources: ["deployments"]
      verbs: ["update"]

这种方法虽然可以临时解决问题，但不是最佳实践，因为它需要用户手动维护这些额外权限。

官方修复

Argo Rollouts 项目团队已经意识到这个问题，并在上游代码库中进行了修复。该修复包含在 v1.7.2 版本中，更新了控制器所需的完整权限集。Helm Chart 会跟随上游版本的发布自动同步这些变更。

最佳实践建议

对于生产环境，建议等待官方发布包含修复的稳定版本（v1.7.2 或更高版本）
在升级前，仔细检查版本变更日志，确认权限相关的修复已经包含
如果必须使用临时解决方案，建议添加明确的注释说明原因，以便后续可以及时移除
定期检查 Argo Rollouts 的更新，及时升级到包含完整功能支持的版本

总结

权限配置是 Kubernetes 控制器正常运行的基础保障。Argo Rollouts 作为一款先进的渐进式交付工具，其功能迭代需要相应的权限支持。通过这次问题的分析和解决过程，我们不仅了解了如何诊断和解决 RBAC 权限问题，也认识到跟随官方版本更新对于系统稳定性的重要性。

argo-helm

ArgoProj Helm Charts

项目地址：https://gitcode.com/gh_mirrors/ar/argo-helm

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

Argo Rollouts 集群角色权限缺失问题分析与解决方案

问题背景

问题现象

根本原因分析

技术细节

解决方案演进

临时解决方案

官方修复

最佳实践建议

总结

热门内容推荐

最新内容推荐

项目优选

Argo Rollouts 集群角色权限缺失问题分析与解决方案

问题背景

问题现象

根本原因分析

技术细节

解决方案演进

临时解决方案

官方修复

最佳实践建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选