Kubernetes安全加固：5个维度从零开始的终极实战指南

2026-05-03 11:45:30作者：蔡怀权

The open source AI engineering platform for agents, LLMs, and ML models. MLflow enables teams of all sizes to debug, evaluate, monitor, and optimize production-quality AI applications while controlling costs and managing access to models and data.

项目地址：https://gitcode.com/GitHub_Trending/ml/mlflow

一、API Server安全配置与访问控制

1.1 认证机制强化与证书管理

风险表现：未授权用户通过匿名访问或弱认证机制获取API Server控制权，导致集群配置被篡改。
加固方法：

启用RBAC（基于角色的访问控制），禁用匿名访问
使用x509证书进行强身份认证，定期轮换证书

# /etc/kubernetes/manifests/kube-apiserver.yaml 关键配置
apiVersion: v1
kind: Pod
metadata:
  name: kube-apiserver
spec:
  containers:
  - command:
    - kube-apiserver
    - --anonymous-auth=false
    - --authorization-mode=RBAC
    - --client-ca-file=/etc/kubernetes/pki/ca.crt
    - --tls-cert-file=/etc/kubernetes/pki/apiserver.crt
    - --tls-private-key-file=/etc/kubernetes/pki/apiserver.key

验证步骤：

# 验证匿名访问已禁用
kubectl get --raw /api/v1 --insecure-skip-tls-verify
# 预期结果：401 Unauthorized

# 检查RBAC配置
kubectl auth can-i create pods --as=system:anonymous
# 预期结果：no

1.2 准入控制插件配置

风险表现：恶意Pod通过特权模式或挂载敏感主机目录实现容器逃逸。
加固方法：

部署PodSecurityPolicy（PSP）或PodSecurityContext限制容器权限
启用AlwaysPullImages确保镜像始终从指定仓库拉取

# 安全上下文示例
apiVersion: v1
kind: Pod
metadata:
  name: security-demo
spec:
  securityContext:
    runAsUser: 1000
    runAsGroup: 3000
    fsGroup: 2000
  containers:
  - name: security-demo-container
    image: busybox
    securityContext:
      allowPrivilegeEscalation: false
      readOnlyRootFilesystem: true
      capabilities:
        drop: ["ALL"]

验证步骤：

# 检查Pod安全上下文
kubectl describe pod security-demo | grep -A 10 "Security Context"

二、容器运行时安全与镜像管理

2.1 容器镜像安全扫描与准入控制

风险表现：使用包含漏洞的基础镜像导致供应链攻击，如Log4j漏洞或恶意后门。
加固方法：

实施镜像扫描策略，拒绝高危漏洞镜像部署
使用私有镜像仓库并配置镜像拉取密钥

攻击案例：某金融机构未扫描镜像导致挖矿程序入侵，攻击者通过包含恶意代码的基础镜像获取节点权限，造成200台服务器被劫持用于加密货币挖矿。

# 安装Trivy镜像扫描工具
curl -sfL https://raw.githubusercontent.com/aquasecurity/trivy/main/contrib/install.sh | sh -s -- -b /usr/local/bin v0.44.1

# 扫描镜像漏洞
trivy image --severity HIGH,CRITICAL myregistry.com/app:v1.0

2.2 运行时资源限制与安全隔离

风险表现：资源耗尽攻击导致集群服务不可用，容器间隔离不足引发横向渗透。
加固方法：

设置CPU/内存请求和限制，防止资源滥用
使用PodAntiAffinity避免关键服务集中部署

# 资源限制示例
apiVersion: v1
kind: Pod
metadata:
  name: resource-demo
spec:
  containers:
  - name: resource-demo-container
    image: nginx
    resources:
      requests:
        cpu: "100m"
        memory: "128Mi"
      limits:
        cpu: "500m"
        memory: "256Mi"

验证步骤：

# 检查资源使用情况
kubectl top pod resource-demo

三、网络安全策略与通信加密

3.1 NetworkPolicy配置与微分段

风险表现：默认允许所有Pod间通信，导致攻击横向扩散，如K8s集群内未隔离的数据库被未授权访问。
加固方法：

实施默认拒绝入站/出站规则
按服务功能划分网络策略，仅允许必要通信

# 数据库网络策略示例
apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: database-policy
spec:
  podSelector:
    matchLabels:
      app: database
  policyTypes:
  - Ingress
  ingress:
  - from:
    - podSelector:
        matchLabels:
          app: backend
    ports:
    - protocol: TCP
      port: 5432

3.2 服务网格与mTLS加密

风险表现：Pod间通信未加密导致敏感数据泄露，如支付信息在传输中被窃听。
加固方法：

部署Istio服务网格实现自动mTLS加密
配置严格的双向TLS认证策略

攻击案例：某电商平台因未加密Pod间通信，攻击者通过ARP欺骗获取订单支付数据，导致10万用户银行卡信息泄露。

# 安装Istio并启用全局mTLS
istioctl install --set profile=demo -y
kubectl apply -f - <<EOF
apiVersion: security.istio.io/v1beta1
kind: PeerAuthentication
metadata:
  name: default
  namespace: default
spec:
  mtls:
    mode: STRICT
EOF

四、节点安全与主机防护

4.1 节点访问控制与权限最小化

风险表现：节点SSH密钥泄露或特权容器导致主机被完全控制。
加固方法：

禁用节点直接SSH访问，使用 bastion 主机
实施节点级别的PodSecurityPolicy限制

⚠️ 警告：永远不要在生产环境中使用hostNetwork: true或privileged: true，除非有绝对必要且经过严格安全评估。

# 节点亲和性与污点配置示例
apiVersion: v1
kind: Pod
metadata单词:
  name: security-node-affinity
spec:
  affinity:
    nodeAffinity:
      requiredDuringSensitiveOperations:
        nodeSelectorTerms:
        - matchExpressions:
          - key: security-context
            operator: In
            values: high
  tolerations:
  - key: "node-role.kubernetes.io/master"
    operator: "Equal"
  containers:
  - name: app
    image: nginx

4.2 容器运行时安全监控

风险表现：容器逃逸攻击，如利用内核漏洞提权，导致主机系统被入侵。
加固方法：

启用内核安全模块（如AppArmor或SELinux）
部署运行时安全监控工具

# 为Pod指定AppArmor配置
cat > /etc/apparmor.d/k8s-app <<EOF
#include <tunables/global>

/opt/myapp {
  # 只允许访问特定目录
  /opt/myapp/** rw,
  /tmp/ rw,
  /dev/null rw,
  /dev/urandom r,
  /usr/bin/* r,
  /lib/x86_64-linux-gnu/libc.so.6 r,
  /lib/x86_64-linux-gnu/libpthread.so.0 r,
  /lib/x86_64-linux-gnu/libgcc_s.so.1 r,
  /lib/x86_64-linux-gnu/libm.so.1 r,
  /bin/sh r,
  /bin/bash r,
  /proc/stat r,
  /proc/meminfo r,
  /proc/cpuinfo r,
  /proc/sys/kernel/random/urandom r,
  /etc/hosts r,
  /etc/resolv.conf r,
  /etc/timezone r,
  /etc/localtime r,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /dev/pts/0 rw,
  /bin/date r,
  /bin/cat r,
  /bin/grep r,
  /usr/bin/wc r,
  /usr/bin/head r,
  /usr/bin/tail r,
  /usr/bin/awk r,
  /usr/bin/sed r,
  /usr/bin/cut r,
  /usr/bin/sort r,
  /usr/bin/uniq r,
  /usr/bin/tr r,
  /usr/bin/head r,
  /usr/bin/tail r,
  /usr/bin/awk r,
  /usr/bin/sed r,
  /usr/bin/cut r,
  /usr/bin/sort r,
  /usr/bin/uniq r,
  /usr/bin/tr r,
  /usr/bin/wc r,
  /usr/bin/head r,
  /usr/bin/tail r,
  /usr/bin/awk r,
  /usr/bin/sed r,
  /usr/bin/curl r,
  /usr/bin/wget r,
  /usr/bin/git r,
  /usr/bin/python3 r,
  /usr/bin/pip3 r,
  /usr/bin/vim r,
  /usr/bin/nano r,
  /usr/bin/less r,
  /usr/bin/more r,
  /usr/bin/man r,
  /usr/bin/info r,
  /usr/bin/clear r,
  /usr/bin/ls r,
  /usr/bin/pwd r,
  /usr/bin/cd,
  /usr/bin/cd /,
  /usr/bin/cd ..,
  /usr/bin/cd ../../,
  /usr/bin/cd ../../../,
  /usr/bin/cd ../../../../,
  /usr/bin/cd ../../../../../,
  /usr/bin/cd ../../../../../../,
  /usr/bin/cd ../../../../../../../,
  /usr/bin/cd ../../../../../../../../,
  /usr/bin/cd ../../../../../../../../../,
  /usr/bin/capsh --print,
  /bin/sh -c "echo test"
}
EOF

# 应用AppArmor配置
sudo apparmor_parser -a /etc/apparmor.d/k8s-app

# 在Pod中使用AppArmor
kubectl apply -f - <<EOF
apiVersion: v1
kind: Pod
metadata:
  name: security-apparmor
  annotations:
    container.apparmor.security.beta.kubernetes.io/app: localhost/k8s-app
spec:
  containers:
  - name: app
    image: nginx
EOF

五、监控、日志与应急响应

5.1 安全监控与告警

风险表现：安全事件未被及时发现，导致攻击持续时间延长，损失扩大。
加固方法：

部署Prometheus + Grafana监控关键指标
设置关键安全事件告警

# Prometheus监控配置示例
apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
  name: kube-apiserver
  namespace: monitoring
spec:
  selector:
    matchLabels:
      app: kube-apiserver
  endpoints:
  - port: https
    scheme: https
    tlsConfig:
      insecureSkipVerify: true
    path: /metrics
    interval: 15s

5.2 审计日志配置与分析

风险表现：发生安全事件后无法追溯攻击路径，难以进行事后分析。
加固方法：

启用并配置审计策略，记录关键操作
集中管理审计日志，定期审查异常行为

# 审计策略示例
apiVersion: audit.k8s.io/v1
kind: Policy
rules:
- level: RequestResponse
  resources:
    - group: ""
      resources: ["secrets", "configmaps"]
    - group: ""
      resources: ["pods", "services", "deployments"]
    - group: ""
      resources: ["nodes"]
  users: ["system:anonymous", "system:serviceaccount:default:default"]
- level: Request
  resources:
    - group: ""
      resources: ["pods/exec", "pods/portforward"]
- level: None
  users: ["kube-proxy"]

安全加固优先级矩阵

风险等级	加固措施	优先级	实施难度
高	启用RBAC和最小权限原则	P0	中
高	实施网络隔离与访问控制	P0	中
高	容器镜像安全扫描	P1	低
中	启用审计日志	P1	低
中	配置资源限制	P2	低
中	实施TLS加密	P2	中
低	安全监控告警	P3	中
低	定期漏洞扫描	P3	低