tch-rs项目在Windows系统下CUDA检测问题分析与解决方案

2025-06-11 20:42:24作者：毕习沙Eudora

问题背景

在使用Rust语言与PyTorch深度学习框架交互的tch-rs库时，许多Windows用户遇到了CUDA无法被正确检测的问题。尽管系统中已经安装了最新版本的CUDA工具包(如12.6版本)，并且PyTorch能够正常识别和使用CUDA，但tch-rs库却报告CUDA不可用。

问题现象

典型的问题表现为：

在Python环境中，PyTorch可以正确识别CUDA设备
系统环境变量配置正确，nvcc编译器版本显示正常
使用tch-rs的Cuda::is_available()方法返回false
即使设置了LIBTORCH_USE_PYTORCH=1环境变量，问题依然存在

根本原因分析

经过深入调查，发现问题的根源在于Windows平台下动态链接库的加载机制。tch-rs在v0.19.0版本中引入了一个优化：如果没有直接引用torch_cuda.dll中的任何符号，系统会将该动态库从依赖关系中移除。这种优化在Linux系统下工作良好，但在Windows平台上会导致CUDA功能无法被正确识别。

解决方案

方法一：强制链接CUDA符号

可以通过在代码中显式声明并调用torch_cuda.dll中的任意一个函数来强制链接该库：

extern "C" {
    #[link_name = "?warp_size@cuda@at@@YAHXZ"]
    fn warp_size() -> i32;
}

fn main() {
    unsafe {
        warp_size();
    }
    // 其他代码...
}

这种方法通过强制引用CUDA相关的符号，确保torch_cuda.dll被正确加载。

方法二：修改构建配置

另一种解决方案是通过修改build.rs构建脚本，显式指定链接参数：

fn main() {
    let os = std::env::var("CARGO_CFG_TARGET_OS").expect("Unable to get TARGET_OS");
    match os.as_str() {
        "linux" | "windows" => {
            if let Some(lib_path) = std::env::var_os("DEP_TCH_LIBTORCH_LIB") {
                println!("cargo:rustc-link-arg=-Wl,-rpath={}", lib_path.to_string_lossy());
            }
            println!("cargo:rustc-link-arg=-Wl,--no-as-needed");
            println!("cargo:rustc-link-arg=-Wl,--copy-dt-needed-entries");
            println!("cargo:rustc-link-arg=-ltorch");
        }
        _ => {}
    }
}