Apache SkyWalking 引入独立配置文件优化 BanyanDB 高级配置

2025-05-08 07:00:09作者：江焘钦

背景介绍

Apache SkyWalking 作为一款优秀的应用性能监控系统，其存储组件 BanyanDB 承担着重要的数据持久化功能。随着系统功能的不断丰富，原有的配置方式逐渐暴露出可读性和可维护性不足的问题。

原有配置方式的局限性

在当前的实现中，所有 BanyanDB 的高级配置都扁平化地存储在 application.yml 文件中，导致配置项名称冗长且缺乏层次结构。例如：

grNormalShardNum
grNormalSIDays
grNormalTTLDays
grSuperShardNum
gmMinuteShardNum
gmHourSIDays

这种命名方式不仅难以记忆，而且无法直观反映配置项之间的逻辑关系。对于运维人员和开发者来说，理解和维护这些配置变得相当困难。

新配置方案设计

为了解决上述问题，SkyWalking 团队决定引入独立的 bydb.yml 配置文件，采用层次化的结构来组织 BanyanDB 的高级配置。新的配置方案具有以下特点：

逻辑分组清晰：将配置按数据类型和用途划分为多个逻辑组
命名简洁直观：使用更自然的命名方式替代原有的缩写
支持环境变量覆盖：保持与 Kubernetes 环境的良好兼容性

配置结构详解

新的 bydb.yml 文件采用树状结构组织配置，主要包含以下几个部分：

记录数据(Records)配置

groups:
  records_normal:
    shard_num: ${SW_STORAGE_BANYANDB_GR_NORMAL_SHARD_NUM:1}
    segment_interval: ${SW_STORAGE_BANYANDB_GR_NORMAL_SI_DAYS:1}
    ttl: ${SW_STORAGE_BANYANDB_GR_NORMAL_TTL_DAYS:3}
  
  records_super:
    shard_num: ${SW_STORAGE_BANYANDB_GR_SUPER_SHARD_NUM:2}
    segment_interval: ${SW_STORAGE_BANYANDB_GR_SUPER_SI_DAYS:1}
    ttl: ${SW_STORAGE_BANYANDB_GR_SUPER_TTL_DAYS:3}

其中，records_normal 用于普通数据集，而 records_super 专为超大数据集设计，如大型追踪或日志数据。

指标数据(Metrics)配置

  metrics_minute:
    shard_num: ${SW_STORAGE_BANYANDB_GM_MINUTE_SHARD_NUM:2}
    segment_interval: ${SW_STORAGE_BANYANDB_GM_MINUTE_SI_DAYS:1}
    ttl: ${SW_STORAGE_BANYANDB_GM_MINUTE_TTL_DAYS:7}
  
  metrics_hour:
    shard_num: ${SW_STORAGE_BANYANDB_GM_HOUR_SHARD_NUM:1}
    segment_interval: ${SW_STORAGE_BANYANDB_GM_HOUR_SI_DAYS:5}
    ttl: ${SW_STORAGE_BANYANDB_GM_HOUR_TTL_DAYS:15}
  
  metrics_day:
    shard_num: ${SW_STORAGE_BANYANDB_GM_DAY_SHARD_NUM:1}
    segment_interval: ${SW_STORAGE_BANYANDB_GM_DAY_SI_DAYS:15}
    ttl: ${SW_STORAGE_BANYANDB_GM_DAY_TTL_DAYS:15}

指标数据根据时间粒度分为分钟级、小时级和天级，每种粒度可以独立配置。

元数据(Metadata)配置

  metadata:
    shard_num: ${SW_STORAGE_BANYANDB_GM_INDEX_SHARD_NUM:2}
    segment_interval: ${SW_STORAGE_BANYANDB_GM_INDEX_SI_DAYS:15}
    ttl: ${SW_STORAGE_BANYANDB_GM_INDEX_TTL_DAYS:15}

元数据组专门用于存储索引模式的数据，如服务流量(service_traffic)和网络地址别名(network_address_alias)等。