DeepSeek-V3模型与Transformers v4.48.0的兼容性问题分析

2025-04-28 07:01:36作者：庞队千Virginia

项目地址：https://gitcode.com/GitHub_Trending/de/DeepSeek-V3

问题背景

DeepSeek-V3系列模型是基于Transformer架构开发的大语言模型，在自然语言处理领域有着广泛应用。近期，Hugging Face Transformers库升级至v4.48.0版本后，用户报告在使用DeepSeek-V3模型时出现了导入错误，具体表现为无法从transformers.pytorch_utils模块导入is_torch_greater_or_equal_than_1_13函数。

技术原因分析

这个兼容性问题源于Hugging Face Transformers库在v4.48.0版本中进行了内部重构，移除了is_torch_greater_or_equal_than_1_13这个辅助函数。该函数原本用于检查PyTorch版本是否大于等于1.13，属于库内部的版本兼容性检查工具。

在DeepSeek-V3的模型实现代码中，多处引用了这个已被移除的函数，导致在较新版本的Transformers中无法正常加载模型。这种情况在开源生态中并不罕见，当底层依赖库进行重大更新时，上层应用需要相应地进行适配。

影响范围

这一问题影响所有使用Transformers v4.48.0及以上版本加载DeepSeek-V3模型的场景。值得注意的是，该问题与Python版本无关，无论是Python 3.9、3.10还是3.12都会遇到相同的导入错误。

解决方案建议

对于遇到此问题的用户，可以考虑以下几种解决方案：

降级Transformers版本：暂时回退到v4.47.0或更早版本，可以规避这个问题。但这不是长期解决方案，可能会错过新版本的重要功能和优化。
修改模型实现：手动修改DeepSeek-V3的模型代码，移除对is_torch_greater_or_equal_than_1_13的依赖。可以替换为直接检查torch.__version__或使用其他版本检查方法。
等待官方更新：DeepSeek团队正在与Hugging Face合作，计划将DeepSeek-V3模型正式集成到Transformers库中。这将从根本上解决兼容性问题。