TransformerLens项目中的Torch安全加载问题解析

2025-07-04 13:28:39作者：明树来

背景介绍

在TransformerLens项目的最新版本中，当使用utils.download_file_from_hf函数下载pickle文件时，会触发来自PyTorch的一个未来警告(FutureWarning)。这个警告主要针对模型加载过程中的安全性问题，提示用户当前默认的weights_only=False参数设置可能存在安全隐患。

问题本质

PyTorch 2.4.1版本引入了一个重要的安全改进，当使用torch.load函数加载模型时，如果保持默认的weights_only=False设置，系统会警告用户这种模式可能执行恶意pickle数据中的任意代码。PyTorch官方明确表示，在未来的版本中，这个参数的默认值将会改为True，以增强安全性。

技术细节分析

在TransformerLens的utils.py文件中，第62行调用了torch.load(file_path, map_location="cpu")，这正是触发警告的根源。PyTorch建议开发者显式设置weights_only参数，特别是当开发者无法完全控制加载的文件来源时。

weights_only=True模式会将反序列化限制为仅加载张量、基本类型、字典以及通过torch.serialization.add_safe_globals()显式添加的类型。这种限制可以有效防止恶意代码的执行。

解决方案探讨

针对这个问题，社区提出了几种解决方案：

最简单的方案是直接在现有代码中添加weights_only=False参数，明确当前行为，消除警告信息。
更完善的方案是向download_file_from_hf函数添加一个可选参数，允许用户自行决定是否启用严格模式。考虑到向后兼容性，默认值可能仍应设为False。
从安全角度考虑，社区成员建议评估是否所有支持的模型都确实需要weights_only=False。如果模型文件仅包含张量和基本类型，那么启用严格模式不会影响功能，同时能提高安全性。