skorch 1.1.0发布：强化scikit-learn兼容性与学习率调度功能

2025-06-10 19:08:40作者：申梦珏Efrain

skorch是一个基于PyTorch的scikit-learn兼容神经网络库，它允许开发者使用熟悉的scikit-learn API来训练PyTorch模型。这个库弥合了深度学习框架PyTorch与传统机器学习库scikit-learn之间的鸿沟，使得PyTorch模型能够无缝集成到scikit-learn的工作流中。

核心更新内容

scikit-learn 1.6.0兼容性增强

skorch 1.1.0最重要的改进之一是全面支持scikit-learn 1.6.0及更高版本。所有神经网络类现在都继承自scikit-learn的BaseEstimator基类，分类模型额外继承ClassifierMixin，回归模型继承RegressorMixin。这一改变确保了skorch模型能够完全兼容最新的scikit-learn生态系统，包括管道(Pipeline)、网格搜索(GridSearchCV)等工具。

学习率调度功能改进

新版本对学习率调度器进行了多项增强：

当使用ReduceLROnPlateau调度器时，现在会默认记录学习率变化到网络历史中(通过net.history[:, 'event_lr']访问)，这为模型训练过程提供了更详细的监控能力。
学习率调度现在支持按批次(batch)更新，而不仅仅是按周期(epoch)更新，这为精细控制训练过程提供了更多灵活性。
调度器的simulate()方法现在支持添加步骤参数，这对于模拟ReduceLROnPlateau等需要基于指标调整学习率的策略特别有用。

新增学习率调度示例

为了帮助用户更好地理解和使用学习率调度功能，项目新增了一个Jupyter Notebook示例，详细展示了如何在skorch中使用各种学习率调度策略。这个示例对于理解如何优化模型训练过程非常有价值。

问题修复

修复了NeuralNetBinaryClassifier与torch.compile的兼容性问题，这使得二进制分类模型现在可以正确使用PyTorch 2.0的编译优化功能。
移除了已弃用的skorch.callbacks.scoring.cache_net_infer功能，保持代码库的整洁性。

技术意义与应用价值

skorch 1.1.0的这些改进使得PyTorch模型能够更好地融入scikit-learn生态系统，特别是在以下方面：

对于需要将深度学习模型与传统机器学习模型结合使用的场景，如集成学习或模型堆叠(stacking)，兼容性的提升使得工作流程更加顺畅。
学习率调度功能的增强为模型训练提供了更精细的控制能力，有助于提升模型性能并加速收敛。
新增的示例文档降低了学习曲线，使得新用户能够更快上手高级功能。

这些改进共同提升了skorch在工业生产环境中的适用性，使其成为连接PyTorch深度学习能力和scikit-learn机器学习工作流的理想桥梁。

登录后查看全文