首页
/ ShedLock与PostgreSQL在Spring Boot中的分布式锁问题解析

ShedLock与PostgreSQL在Spring Boot中的分布式锁问题解析

2025-06-18 08:41:43作者:毕习沙Eudora

问题背景

在使用Spring Boot应用配合ShedLock实现分布式任务调度时,开发人员遇到了一个典型问题:当应用部署在Rancher的多个POD中运行时,其中一个POD能够成功获取锁并执行任务,而另一个POD则抛出事务冲突异常。

技术栈环境

  • Spring Boot 2.5.15
  • Java 11
  • ShedLock 4.47.0
  • PostgreSQL数据库
  • Rancher容器平台

问题现象

在双POD部署环境下,观察到以下行为:

  1. POD1能够正常获取锁并执行定时任务
  2. POD2在尝试获取锁时抛出异常:
    org.postgresql.util.PSQLException: ERROR: Transaction expired or aborted by a conflict: 40001
    
  3. 异常后,POD2会多次尝试获取锁但均失败

配置分析

应用的ShedLock配置如下:

@Configuration
@EnableSchedulerLock(defaultLockAtMostFor = "PT5M")
public class SchedulerDataSource {
    @Bean
    public LockProvider lockProvider(DataSource dataSource) {
        return new JdbcTemplateLockProvider(
            JdbcTemplateLockProvider.Configuration.builder()
                .withJdbcTemplate(new JdbcTemplate(dataSource))
                .usingDbTime()
                .build()
        );
    }
}

定时任务配置:

@Scheduled(cron = "* */10 * ? * *")
@SchedulerLock(name = "processingTask", lockAtLeastFor = "PT5M", lockAtMostFor = "PT7M")
public void processData() {
    LockAssert.assertLocked();
    // 业务逻辑
}

问题根源

  1. 事务冲突:PostgreSQL检测到并发事务冲突,主动终止了其中一个事务(错误码40001表示序列化失败)
  2. 时间同步:虽然配置了usingDbTime(),但在高并发场景下仍可能出现微秒级的竞争
  3. 版本兼容性:使用的ShedLock 4.47.0可能存在已知的并发问题

解决方案

  1. 升级ShedLock版本:建议升级到最新稳定版,新版本对并发控制有优化
  2. 调整锁参数
    • 增加lockAtLeastForlockAtMostFor的时间差
    • 确保锁持有时间足够覆盖任务执行时间
  3. 数据库优化
    • 检查PostgreSQL的事务隔离级别
    • 考虑调整PostgreSQL的死锁检测参数
  4. 重试机制:对于瞬态错误可考虑实现自定义重试逻辑

最佳实践建议

  1. 版本选择:保持ShedLock与Spring Boot版本的兼容性
  2. 锁命名:确保锁名称具有业务含义且唯一
  3. 时间设置
    • lockAtLeastFor应大于任务最短执行时间
    • lockAtMostFor应留有足够缓冲
  4. 监控:实现锁获取失败的告警机制
  5. 日志:增加详细的锁操作日志便于问题排查

总结

分布式锁在微服务架构中是常见需求,ShedLock提供了轻量级的解决方案。但在实际应用中需要注意版本选择、参数配置和环境因素。通过合理的配置和升级,可以避免大多数并发问题,确保分布式任务调度的可靠性。

登录后查看全文
热门项目推荐
相关项目推荐