feizhiyun/jumpserver 高可用部署：集群模式搭建指南

2026-02-04 04:27:13作者：咎竹峻Karen

引言：为什么需要高可用部署？

在企业级生产环境中，JumpServer作为核心的堡垒机系统，承载着关键的系统访问控制和审计功能。单点故障可能导致整个运维体系的瘫痪，造成严重的安全隐患和业务中断。高可用（High Availability）部署通过集群化架构确保服务连续性，提供故障自动转移和负载均衡能力。

本文将详细介绍JumpServer高可用集群的完整部署方案，涵盖架构设计、环境准备、配置优化和故障恢复策略。

高可用架构设计

集群架构概览

JumpServer高可用集群采用分布式架构，主要包含以下核心组件：

flowchart TD
    A[负载均衡器<br/>Nginx/HAProxy] --> B[Web节点1<br/>Core + Lina]
    A --> C[Web节点2<br/>Core + Lina]
    A --> D[Web节点N<br/>Core + Lina]
    
    B --> E[共享数据库集群<br/>PostgreSQL]
    C --> E
    D --> E
    
    B --> F[共享缓存集群<br/>Redis Sentinel]
    C --> F
    D --> F
    
    G[终端连接器集群<br/>KoKo/Lion/Chen] --> E
    G --> F
    H[客户端请求] --> A

组件职责说明

组件类型	部署方式	高可用方案	备注
Web服务层	多节点部署	负载均衡 + 会话保持	无状态服务，易于水平扩展
数据库层	主从集群	PostgreSQL流复制	建议3节点以上集群
缓存层	Redis哨兵	Redis Sentinel	至少3节点确保选举
连接器层	多实例部署	服务注册发现	KoKo、Lion等组件

环境准备与规划

硬件资源规划

节点角色	CPU	内存	存储	网络	数量
Web节点	4核	8GB	50GB	千兆	2+
数据库节点	8核	16GB	200GB	千兆	3
Redis节点	2核	4GB	20GB	千兆	3
连接器节点	4核	8GB	100GB	千兆	2+

软件版本要求

# 操作系统
Ubuntu 20.04+ / CentOS 7.9+

# 数据库
PostgreSQL 12+

# 缓存
Redis 6.0+

# JumpServer版本
JumpServer v3.0+

详细部署步骤

第一步：数据库集群部署

PostgreSQL流复制配置

主节点配置（postgresql.conf）：

listen_addresses = '*'
wal_level = replica
max_wal_senders = 10
max_replication_slots = 10
hot_standby = on

从节点配置：

hot_standby = on

创建复制用户：

CREATE USER replicator WITH REPLICATION ENCRYPTED PASSWORD 'secure_password';

第二步：Redis哨兵集群

Redis主从配置

主节点redis.conf：

bind 0.0.0.0
requirepass your_redis_password
masterauth your_redis_password

从节点配置：

replicaof <master-ip> 6379
masterauth your_redis_password

Sentinel哨兵配置

sentinel.conf：

sentinel monitor mymaster <master-ip> 6379 2
sentinel auth-pass mymaster your_redis_password
sentinel down-after-milliseconds mymaster 5000
sentinel failover-timeout mymaster 60000

第三步：JumpServer Web节点部署

多节点配置文件

config.yml 公共配置：

# 数据库配置
DB_ENGINE: postgresql
DB_HOST: pg-cluster.example.com
DB_PORT: 5432
DB_USER: jumpserver
DB_PASSWORD: ${DB_PASSWORD}
DB_NAME: jumpserver

# Redis配置
REDIS_HOST: redis-sentinel.example.com
REDIS_PORT: 26379
REDIS_PASSWORD: ${REDIS_PASSWORD}
REDIS_SERVICE_NAME: mymaster

# 集群配置
CLUSTER_NODE_NAME: node-${HOSTNAME}
SESSION_COOKIE_DOMAIN: .jumpserver.example.com

会话共享配置

确保所有Web节点使用相同的秘钥和会话存储：

# 生成共享秘钥
openssl rand -base64 49

# 配置Redis会话存储
SESSION_ENGINE: django.contrib.sessions.backends.cache
SESSION_CACHE_ALIAS: default

第四步：负载均衡配置

Nginx负载均衡配置

upstream jumpserver_web {
    ip_hash;
    server web-node-1:8080 weight=3;
    server web-node-2:8080 weight=3;
    server web-node-3:8080 weight=3;
    keepalive 32;
}

server {
    listen 80;
    server_name jumpserver.example.com;
    
    location / {
        proxy_pass http://jumpserver_web;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;
    }
    
    # WebSocket支持
    location /ws/ {
        proxy_pass http://jumpserver_web;
        proxy_http_version 1.1;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
    }
}

高可用验证与测试

健康检查机制

# 数据库连接检查
pg_isready -h pg-cluster.example.com -p 5432

# Redis集群状态检查
redis-cli -h redis-sentinel.example.com -p 26379 sentinel masters

# Web节点健康检查
curl -I http://web-node-1:8080/api/health/

故障转移测试

sequenceDiagram
    participant C as Client
    participant LB as Load Balancer
    participant W1 as Web Node 1
    participant W2 as Web Node 2
    participant DB as Database
    participant R as Redis

    C->>LB: 请求1 (Session A)
    LB->>W1: 转发请求
    W1->>DB: 查询数据
    W1->>R: 存储会话
    W1-->>C: 响应1
    
    Note over W1: 模拟节点故障
    C->>LB: 请求2 (Session A)
    LB->>W2: 转发请求
    W2->>R: 获取会话数据
    W2->>DB: 查询数据
    W2-->>C: 响应2 (会话保持)

监控与维护

关键监控指标

监控项	告警阈值	检查频率	处理措施
数据库连接数	>80%最大连接数	1分钟	优化查询或扩容
Redis内存使用	>85%	5分钟	清理缓存或扩容
Web节点响应时间	>200ms	1分钟	优化代码或扩容
会话同步延迟	>1秒	30秒	检查网络或调整配置

日常维护命令

# 集群状态检查
jms status --cluster

# 数据库备份
pg_dump -h pg-cluster.example.com -U jumpserver jumpserver > backup.sql

# 日志分析
tail -f /opt/jumpserver/logs/core.log | grep -E "(ERROR|WARNING)"

# 性能监控
jms top --cluster

故障处理与恢复

常见故障场景处理

flowchart TD
    A[故障检测] --> B{故障类型}
    B --> C[Web节点故障]
    B --> D[数据库主节点故障]
    B --> E[Redis主节点故障]
    
    C --> F[负载均衡器自动剔除故障节点]
    F --> G[运维人员排查修复]
    G --> H[重新加入集群]
    
    D --> I[PostgreSQL自动故障转移]
    I --> J[提升从节点为主节点]
    J --> K[重建复制关系]
    
    E --> L[Redis Sentinel自动选举新主]
    L --> M[更新客户端连接]
    M --> N[集群恢复正常]

应急恢复脚本

#!/bin/bash
# jumpserver_cluster_recovery.sh

# 检查数据库集群状态
check_db_cluster() {
    echo "检查数据库集群状态..."
    # 实现数据库状态检查逻辑
}

# 检查Redis哨兵状态
check_redis_sentinel() {
    echo "检查Redis哨兵状态..."
    # 实现Redis状态检查逻辑
}

# 重启故障服务
restart_failed_services() {
    echo "重启故障服务..."
    # 实现服务重启逻辑
}

# 主恢复流程
main() {
    check_db_cluster
    check_redis_sentinel
    restart_failed_services
    echo "集群恢复完成"
}

main "$@"

性能优化建议

数据库优化

-- 创建关键索引
CREATE INDEX idx_assets_hostname ON assets_asset(hostname);
CREATE INDEX idx_sessions_user_id ON terminal_session(user_id);
CREATE INDEX idx_audits_datetime ON audits_operatelog(datetime);

-- 查询优化建议
EXPLAIN ANALYZE SELECT * FROM large_table WHERE condition;

缓存策略优化

# Redis缓存配置优化
CACHE_TTL: 3600
SESSION_TIMEOUT: 7200
CACHE_MAX_ENTRIES: 10000

# 连接池配置
REDIS_MAX_CONNECTIONS: 100
DB_MAX_CONNECTIONS: 50

总结

JumpServer高可用集群部署是一个系统工程，需要从架构设计、环境准备、部署实施到监控维护全流程考虑。通过本文介绍的方案，您可以构建一个稳定、可靠的生产环境集群，确保企业运维安全体系的连续性。

部署 checklist

[ ] 数据库集群部署与测试
[ ] Redis哨兵集群配置
[ ] 多Web节点环境准备
[ ] 负载均衡器配置
[ ] 会话共享机制验证
[ ] 监控告警设置
[ ] 备份恢复方案测试
[ ] 故障转移演练

后续优化方向

自动化部署：使用Ansible/Terraform实现一键部署
容器化部署：基于Docker/Kubernetes的容器化方案
多地域容灾：跨地域的多活架构设计
智能弹性伸缩：基于负载的自动扩缩容

通过持续优化和改进，您的JumpServer集群将能够更好地支撑企业级的安全运维需求。

JumpServer

广受欢迎的开源堡垒机

项目地址：https://gitcode.com/feizhiyun/jumpserver

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

347

193

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

1.12 K

265