ShedLock 项目中优雅关闭与锁释放问题的分析与解决

2025-06-18 10:52:08作者：昌雅子Ethen

背景介绍

在分布式系统中，定时任务的调度是一个常见需求。ShedLock 是一个轻量级的分布式锁库，用于确保定时任务在分布式环境中只在一个节点上执行。然而，在实际应用中，当系统需要优雅关闭时，ShedLock 的锁释放机制可能会遇到一些问题。

问题现象

在 Spring Boot 应用中配置了 ShedLock 后，当系统接收到 SIGTERM 信号时，会出现以下行为序列：

系统开始关闭流程
正在执行的定时任务被终止
系统尝试释放持有的锁
锁释放过程中抛出 LockException
尽管抛出异常，锁实际上已被成功释放

问题分析

从异常堆栈中可以清楚地看到问题的根源：

当系统开始关闭时，Spring 会中断所有正在执行的线程
ShedLock 尝试通过 Redis 删除锁节点
由于线程已被中断，Redis 操作被取消
抛出 RedisCommandInterruptedException
最终包装为 LockException 向上抛出

虽然异常被抛出，但 Redis 操作可能在中断前已经完成，因此锁实际上被释放了。这种不一致的状态可能会导致日志中出现错误信息，给运维人员带来困扰。

解决方案

针对这个问题，ShedLock 提供了几种解决方案：

1. 使用 TrackingLockProviderWrapper

ShedLock 提供了一个 TrackingLockProviderWrapper 工具类，它可以跟踪当前持有的锁。在关闭时，可以显式释放这些锁：

@Bean
public LockProvider lockProvider(RedisConnectionFactory connectionFactory) {
    return new TrackingLockProviderWrapper(new RedisLockProvider(connectionFactory));
}

@PreDestroy
public void unlockAll() {
    TrackingLockProviderWrapper.retryOnInterruptedException(() -> 
        lockProvider.getActiveLocks().forEach(Lock::unlock)
    );
}

这种方法确保在关闭时所有活跃的锁都会被正确释放。

2. 配置合理的锁超时时间

确保 lockAtMostFor 参数设置合理，这样即使锁没有被显式释放，也会在超时后自动失效：

@SchedulerLock(name = "taskName", lockAtMostFor = "10s")
public void scheduledTask() {
    // 任务逻辑
}

3. 自定义锁提供者

可以继承现有的锁提供者，重写解锁逻辑，使其在中断情况下更加健壮：

public class RobustRedisLockProvider extends RedisLockProvider {
    @Override
    protected void doUnlock(String lockKey) {
        try {
            super.doUnlock(lockKey);
        } catch (LockException e) {
            if (Thread.currentThread().isInterrupted()) {
                // 如果是中断导致的异常，可以记录日志但不需要处理
                log.warn("锁释放被中断，但可以忽略");
            } else {
                throw e;
            }
        }
    }
}