JeecgBoot项目中Redis集群节点失效处理机制解析

2025-05-03 02:43:45作者：舒璇辛Bertina

AI 低代码平台「低代码 + 零代码」双驱动！低代码可一键生成前后端代码;零代码可 5 分钟搭建系统;AI Skills 一句话画流程、设计表单、生成整套系统。内置 AI聊天、知识库、流程编排、MCP插件等，兼容主流大模型。引领「AI 生成 → 在线配置 → 代码生成 → 手工合并->AI修改」开发模式，消除 Java 项目 80% 的重复工作，提效而不失灵活。

项目地址：https://gitcode.com/GitHub_Trending/je/jeecg-boot

在JeecgBoot项目中使用Redis集群时，当某个节点服务停止后，系统仍会持续尝试连接该失效节点，导致页面请求超时报错。本文将深入分析这一现象的原因，并提供完整的解决方案。

问题现象分析

当Redis集群中某个节点（如192.168.0.147:6379）停止服务后，系统日志显示客户端持续尝试重连该节点：

2024-09-24 19:49:10.854 [lettuce-eventExecutorLoop-1-11] INFO  Reconnecting, last destination was /192.168.0.147:6379
2024-09-24 19:49:12.872 [lettuce-nioEventLoop-4-14] WARN  Cannot reconnect to [192.168.0.147:6379]

最终导致业务请求超时：

org.springframework.dao.QueryTimeoutException: Redis command timed out after 1 minute(s)

技术背景

JeecgBoot默认使用Lettuce作为Redis客户端连接集群环境。与Jedis相比，Lettuce具有以下特性：

异步非阻塞IO：基于Netty实现，性能更高
集群拓扑自动刷新：支持动态感知集群节点变化
连接自动恢复：内置重连机制

根本原因

问题产生的核心原因在于默认配置下，Lettuce虽然会自动重连失效节点，但不会自动从集群拓扑中移除不可用节点。这导致：

客户端仍将请求路由到已失效节点
每次请求都需要等待超时后才能失败
系统资源被无效的重连操作占用

解决方案

通过配置Lettuce的集群拓扑自动刷新机制，可以解决此问题：

spring:
  redis:
    lettuce:
      cluster:
        refresh:
          adaptive: true  # 启用自适应拓扑刷新

此配置的作用机制：

动态感知：定期检查集群节点状态
自动清理：从拓扑中移除不可用节点
负载均衡：将请求自动路由到健康节点

配置优化建议

除了启用拓扑刷新外，还可对Redis集群连接进行以下优化：

spring:
  redis:
    cluster:
      nodes:
        - 192.168.0.149:6379
        - 192.168.0.140:6379
        - 192.168.0.147:6379
    lettuce:
      pool:
        max-active: 20      # 根据并发量调整
        max-idle: 10
        min-idle: 5
        max-wait: 30000    # 适当延长等待时间
      cluster:
        refresh:
          adaptive: true
          period: 5000     # 拓扑刷新间隔(毫秒)