CrunchyData Postgres Operator在OpenShift上使用Endpoints的权限问题分析

2025-06-15 00:57:05作者：凌朦慧Richard

问题背景

在使用CrunchyData Postgres Operator(v5版本)部署PostgreSQL集群到OpenShift环境时，数据库容器启动失败并出现权限错误。错误日志显示Patroni组件无法更新leader锁，具体报错为"endpoints is forbidden: endpoint address is not allowed"。

问题根源

经过分析，这个问题主要与OpenShift环境下的安全约束有关：

Endpoints资源权限不足：Patroni默认配置use_endpoints: true，尝试使用Kubernetes Endpoints资源来实现高可用机制，但在OpenShift环境下需要额外的RBAC权限。
OpenShift安全上下文约束(SCC)：OpenShift的默认安全策略限制了Pod使用Endpoints资源的能力，特别是当Pod运行在默认命名空间时。
Operator配置问题：如果错误地将openshift参数设置为false，会导致Operator不应用OpenShift特定的配置。

解决方案

1. 正确的RBAC配置

确保为Postgres Operator配置了足够的权限，特别是对Endpoints资源的访问权限。在RBAC配置中需要包含：

- apiGroups: [""]
  resources: ["endpoints", "endpoints/restricted"]
  verbs: ["create"]

2. 命名空间选择

避免在OpenShift的默认命名空间中部署PostgreSQL集群，包括：

default
kube-system
kube-public
openshift-node
openshift-infra
openshift

3. 正确的OpenShift配置

确保PostgresCluster资源中正确设置了OpenShift参数：

spec:
  openshift: true

4. 安全上下文约束(SCC)处理

如果遇到SCC相关问题，可以考虑以下方案：

为PostgreSQL Pod创建专用服务账户
将该服务账户绑定到适当的SCC策略(如restricted)
避免使用anyuid SCC除非必要

经验总结

在OpenShift上部署Postgres Operator时，需要特别注意平台特定的安全机制。正确配置RBAC和SCC是确保PostgreSQL集群正常运行的关键。对于已经存在的集群，建议：

检查现有RBAC配置是否完整
验证openshift参数设置
考虑创建新的测试集群验证配置
避免修改平台级别的安全策略作为临时解决方案

通过以上措施，可以解决Endpoints资源访问被拒绝的问题，确保PostgreSQL集群在OpenShift环境中稳定运行。

postgres-operator

Production PostgreSQL for Kubernetes, from high availability Postgres clusters to full-scale database-as-a-service.

项目地址：https://gitcode.com/gh_mirrors/post/postgres-operator

登录后查看全文