ONNX Runtime 1.20.1 在 CUDA 12.8 下的构建问题分析与解决方案

2025-05-14 10:02:19作者：邵娇湘

microsoft/onnxruntime: 是一个用于运行各种机器学习模型的开源库。适合对机器学习和深度学习有兴趣的人，特别是在开发和部署机器学习模型时需要处理各种不同框架和算子的人。特点是支持多种机器学习框架和算子，包括 TensorFlow、PyTorch、Caffe 等，具有高性能和广泛的兼容性。

项目地址：https://gitcode.com/GitHub_Trending/on/onnxruntime

问题背景

在构建 ONNX Runtime 1.20.1 版本时，当使用 CUDA 12.8.0 作为计算平台并在 AlmaLinux 8 系统上进行编译时，开发者遇到了一个编译错误。这个错误源于 ONNX Runtime 代码中使用了已被 CUDA 标记为废弃的 Thrust 库中的 unary_function 模板结构体。

技术细节分析

Thrust 是 CUDA 提供的一个类似于 C++ STL 的并行算法库，它简化了 GPU 编程。在 ONNX Runtime 的 CUDA 提供者实现中，特别是在 compress_impl.cu 文件的第 26 行，代码定义了一个名为 CastToInt32 的结构体，它继承自 thrust::unary_function<int8_t, int32_t>。

随着 CUDA 12.8 的发布，NVIDIA 已经将 thrust::unary_function 标记为废弃(deprecated)，这导致在编译时（特别是当编译器将警告视为错误时）构建过程会失败。

根本原因

这个问题的根本原因在于：

API 演进：CUDA 生态系统持续演进，一些旧的接口被新的、更优的替代方案所取代
严格编译设置：现代构建系统通常会将编译器警告视为错误，以确保代码质量
版本兼容性：ONNX Runtime 1.20.1 发布时可能尚未完全适配 CUDA 12.8 的新特性

解决方案

对于遇到此问题的开发者，有以下几种解决方案：

临时解决方案

禁用特定警告：在构建时添加编译器标志 -Wno-error=deprecated-declarations，这将允许编译继续，尽管使用了废弃的 API。
使用旧版 CUDA：暂时回退到 CUDA 12.7 或更早版本进行构建，直到问题得到官方修复。

长期解决方案

代码修改：修改 compress_impl.cu 文件，不再使用 thrust::unary_function，而是使用现代 C++ 的替代方案。

例如，可以改为使用 C++11 的标准函数对象基类：
```
struct CastToInt32 {
    __host__ __device__
    int32_t operator()(int8_t x) const {
        return static_cast<int32_t>(x);
    }
};
```
等待官方更新：关注 ONNX Runtime 的 GitHub 仓库，等待官方发布适配 CUDA 12.8 的版本更新。