Rancher Fleet 项目中的自定义注解功能解析

2025-07-10 17:24:07作者：廉彬冶Miranda

Deploy workloads from Git to large fleets of Kubernetes clusters

项目地址：https://gitcode.com/gh_mirrors/fleet/fleet

概述

在Kubernetes生态系统中，Rancher Fleet作为一款强大的GitOps工具，提供了集群和应用管理的解决方案。本文将深入探讨Fleet项目中新增的自定义注解功能，该功能允许用户为fleet-controller和gitjob组件分别配置特定的监控注解。

功能背景

在分布式系统监控场景中，我们经常需要为不同组件配置独立的监控指标采集策略。Fleet项目的最新版本(v0.13.0-alpha.3)引入了一项重要改进，支持通过Helm chart的extraAnnotations参数为fleet-controller和gitjob组件分别设置不同的监控注解。

技术实现细节

注解配置结构

Fleet的Helm chart现在支持以下配置结构：

extraAnnotations:
  fleetController:
    ad.stackstate.com/fleet-controller.check_names: '["openmetrics"]'
    ad.stackstate.com/fleet-controller.init_configs: '[{}]'
    ad.stackstate.com/fleet-controller.instances: |
      [ 
        {
          "prometheus_url": "http://%%host%%:8080/metrics",
          "namespace": "cattle_fleet_system", 
          "metrics": ["*"]
        }
      ]
  gitjob:
    ad.stackstate.com/gitjob.check_names: '["openmetrics"]'
    ad.stackstate.com/gitjob.init_configs: '[{}]'
    ad.stackstate.com/gitjob.instances: |
      [ 
        {
          "prometheus_url": "http://%%host%%:8081/metrics",
          "namespace": "cattle_fleet_system", 
          "metrics": ["*"]
        }
      ]

关键特性解析

组件独立配置：可以分别为fleet-controller和gitjob配置不同的监控端点(8080和8081端口)
灵活的通配符支持：使用%%host%%占位符自动替换为Pod的实际主机地址
全量指标采集：通过"metrics": ["*"]配置采集所有可用指标
命名空间隔离：指标自动归类到cattle_fleet_system命名空间

实际应用场景

这种细粒度的注解配置特别适合以下场景：

多组件监控：当需要监控Fleet系统中不同组件的运行状态时
指标隔离：需要将不同组件的指标分类到不同命名空间
自定义采集：针对特定组件配置不同的采集频率或过滤规则

验证与测试

用户可以通过以下步骤验证注解是否生效：

部署配置了extraAnnotations的Fleet实例
检查fleet-controller和gitjob Pod的metadata.annotations字段
确认监控系统(如SUSE Observability)已接收到来自两个组件的指标数据

总结

Rancher Fleet的这一增强功能为系统监控提供了更大的灵活性，使得运维团队能够更精细地控制各个组件的监控行为。通过合理的注解配置，可以实现全面的系统可观测性，及时发现并解决潜在问题。

随着GitOps实践的普及，这种细粒度的配置能力将成为复杂系统管理的标配功能，帮助团队构建更可靠、更易维护的云原生基础设施。

Deploy workloads from Git to large fleets of Kubernetes clusters

项目地址：https://gitcode.com/gh_mirrors/fleet/fleet

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。