KubeBlocks中RisingWave集群创建异常问题分析与解决方案

2025-06-30 19:57:49作者：庞眉杨Will

KubeBlocks is a Kubernetes Operator designed to manage a variety of databases and streaming systems, including MySQL, PostgreSQL, MongoDB, Redis, RabbitMQ, RocketMQ, and more, within Kubernetes environments.

项目地址：https://gitcode.com/gh_mirrors/ku/kubeblocks

问题现象

在使用KubeBlocks创建RisingWave集群时，用户反馈集群状态显示为"Abnormal"(异常)。通过查看日志发现，RisingWave的meta组件(rwcluster-meta-0)启动失败，主要报错信息表明系统缺少必要的环境变量配置。

问题根源分析

RisingWave作为云原生流式数据库，其正常运行依赖于若干关键配置参数，特别是与存储后端相关的设置。在KubeBlocks中创建RisingWave集群时，必须正确配置以下核心参数：

状态存储配置：RisingWave需要配置状态存储后端，通常使用S3兼容存储
AWS相关凭证：包括访问密钥、区域信息等
ETCD端点：用于分布式协调
数据目录：指定数据存储路径

解决方案

正确创建集群的配置方法

在KubeBlocks中创建RisingWave集群时，必须通过annotations字段提供必要的环境变量配置。以下是一个完整的集群定义示例：

kind: Cluster
metadata:
  name: risingwave-cluster
  namespace: demo
  annotations:
    "kubeblocks.io/extra-env": "{
      \"RW_STATE_STORE\":\"hummock+s3://YOUR-BUCKET\",
      \"AWS_REGION\":\"YOUR-REGION\",
      \"AWS_ACCESS_KEY_ID\":\"YOUR-AK\",
      \"AWS_SECRET_ACCESS_KEY\":\"YOUR-SK\",
      \"RW_DATA_DIRECTORY\":\"risingwave\",
      \"RW_S3_ENDPOINT\":\"https://s3.YOUR-REGION.amazonaws.com.cn\",
      \"RW_ETCD_ENDPOINTS\":\"YOUR-ETCD-ENDPOINT:2379\",
      \"RW_ETCD_AUTH\":\"false\"
    }"
spec:
  clusterDefinitionRef: risingwave
  clusterVersionRef: risingwave-v1.0.0
  componentSpecs:
  - componentDefRef: frontend
    name: frontend
    replicas: 1
    resources:
      limits: {cpu: "1", memory: "1Gi"}
      requests: {cpu: "500m", memory: "500Mi"}
  - componentDefRef: meta
    name: meta
    replicas: 1
    resources: {limits: {cpu: "1", memory: "1Gi"}, requests: {cpu: "500m", memory: "500Mi"}}
  - componentDefRef: compute
    name: compute
    replicas: 1
    resources: {limits: {cpu: "1", memory: "1Gi"}, requests: {cpu: "500m", memory: "500Mi"}}
  - componentDefRef: compactor
    name: compactor
    replicas: 1
    resources: {limits: {cpu: "1", memory: "1Gi"}, requests: {cpu: "500m", memory: "500Mi"}}
  - componentDefRef: connector
    name: connector
    replicas: 1
    resources: {limits: {cpu: "1", memory: "1Gi"}, requests: {cpu: "500m", memory: "500Mi"}}

关键配置参数说明

RW_STATE_STORE：指定状态存储后端，格式为hummock+s3://bucket-name
AWS相关参数：
- AWS_REGION：S3存储桶所在区域
- AWS_ACCESS_KEY_ID：访问密钥ID
- AWS_SECRET_ACCESS_KEY：访问密钥
- RW_S3_ENDPOINT：S3服务端点
ETCD配置：
- RW_ETCD_ENDPOINTS：ETCD服务地址
- RW_ETCD_AUTH：是否启用认证
数据目录：RW_DATA_DIRECTORY指定数据存储路径