首页
/ Redisson集群拓扑更新异常问题分析与修复

Redisson集群拓扑更新异常问题分析与修复

2025-05-09 12:14:43作者:邬祺芯Juliet

问题背景

在Redis集群环境中,当发生主从切换时,Redisson客户端(3.28.0及以上版本)可能会出现集群拓扑信息更新不及时的问题。具体表现为客户端持续将请求发送到错误的节点(原主节点或新从节点),导致Redis返回MOVED错误,而客户端无法自动恢复,必须重启应用才能解决。

问题现象

用户报告在Redis集群频繁主从切换时,Redisson客户端会出现以下异常:

org.redisson.client.RedisTimeoutException: Unable to acquire connection! 
NodeSource [slot=7685, addr=redis://10.225.91.213:6379, redisClient=null, redirect=MOVED, entry=null]

异常表明客户端尝试连接到一个已经不再是主节点的Redis实例,且无法自动更新集群拓扑信息。

问题复现

通过测试可以稳定复现该问题:

  1. 将Redis从节点提升为主节点
  2. 将原主节点重新提升回主节点
  3. 此时Redisson客户端拓扑信息不会更新

使用Arthas工具检查发现,Redisson内部的MasterSlaveEntry对象中包含了错误的主节点信息,与实际集群拓扑不一致。

问题分析

通过版本对比和日志分析,可以确定:

  1. 该问题从Redisson 3.28.0版本开始出现
  2. 在3.27.2及以下版本中,主从切换后客户端能正确更新拓扑
  3. 问题核心在于客户端在第二次主从切换(即恢复原主节点)时,未能正确接收和处理集群拓扑变更事件

日志分析显示:

  • 第一次主从切换时,Redisson能正确记录变更
  • 第二次切换回原主节点时,没有相关日志输出
  • 客户端仍尝试向已降级为从节点的实例发送写请求

影响范围

该问题对系统的影响包括:

  1. 导致大量请求被错误路由,产生MOVED响应
  2. 在Tomcat Session Manager等场景下可能导致服务不可用
  3. 显著增加Redis集群的操作压力(OPs可能增长5倍)

解决方案

Redisson开发团队已在3.33.0版本中修复了该问题。对于无法立即升级的用户,临时解决方案包括:

  1. 降级到3.27.2版本
  2. 在应用层实现监控和自动恢复机制
  3. 优化Redis集群稳定性,减少不必要的主从切换

最佳实践建议

  1. 对于生产环境,建议使用稳定的Redisson版本(3.33.0及以上)
  2. 实施Redis集群健康监控,避免频繁主从切换
  3. 在客户端配置合理的重试机制和超时设置
  4. 定期检查客户端与集群拓扑的一致性

该问题的修复显著提升了Redisson在Redis集群不稳定场景下的健壮性,确保了分布式系统的高可用性。

登录后查看全文
热门项目推荐

项目优选

收起
openHiTLS-examplesopenHiTLS-examples
本仓将为广大高校开发者提供开源实践和创新开发平台,收集和展示openHiTLS示例代码及创新应用,欢迎大家投稿,让全世界看到您的精巧密码实现设计,也让更多人通过您的优秀成果,理解、喜爱上密码技术。
C
54
469
kernelkernel
deepin linux kernel
C
22
5
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
880
519
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
336
1.1 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
181
264
cjoycjoy
一个高性能、可扩展、轻量、省心的仓颉Web框架。Rest, 宏路由,Json, 中间件,参数绑定与校验,文件上传下载,MCP......
Cangjie
87
14
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.09 K
0
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
361
381
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
613
60