SimpleTuner项目中学习率调度器的Sine模式问题分析与修复

2025-07-03 11:12:34作者：伍希望

问题背景

在深度学习模型训练过程中，学习率调度器(Learning Rate Scheduler)是优化训练效果的重要组件。SimpleTuner项目提供了多种学习率调度策略，包括常见的多项式(polynomial)和正弦(sine)模式。近期发现项目中正弦模式的学习率调度存在两个关键问题：

学习率下限(lr_end)参数对正弦调度器无效，实际学习率下限始终为初始学习率的一半
从检查点恢复训练时，T_cur(当前周期步数)计算不正确，影响学习率调整的准确性

技术分析

正弦调度器实现问题

原始的正弦学习率调度公式存在数学表达上的缺陷。观察代码实现可以发现：

lrs = [
    (base_lr - self.eta_min)  # 基础学习率与最小学习率之差
    * (math.cos(math.pi + math.pi * self.T_cur / self.T_i*2) * 0.5 + 0.5)
    + self.eta_min
    for base_lr in self.base_lrs
]

这个实现存在两个主要问题：

周期计算不完整：原始实现中T_cur / self.T_i的比例关系导致一个完整周期需要两倍于T_i的步数才能完成，这与设计意图不符
学习率下限控制失效：由于余弦函数的取值范围处理不当，导致实际学习率下限无法正确反映eta_min参数设置

检查点恢复问题

在从检查点恢复训练时，调度器的step()函数未能正确处理T_cur的计算。具体表现为：

当step参数为None时，代码错误地使用了last_epoch参数
这导致周期步数计算不准确，进而影响学习率的正确调整

解决方案

项目维护者采纳了以下修复方案：

修正正弦调度公式：调整周期计算方式，确保一个完整周期在T_i步内完成
统一正弦和余弦实现：保持与余弦调度器相似的数学表达形式，确保参数行为一致
完善检查点恢复逻辑：修正T_cur计算方式，确保恢复训练时学习率调整的连续性

修正后的正弦调度器实现如下：

lrs = [
    (base_lr - self.eta_min)
    * (-math.cos(math.pi + math.pi * self.T_cur / self.T_i*2) * 0.5 + 0.5)
    + self.eta_min
    for base_lr in self.base_lrs
]