PyVideoTrans项目中CUDA与cuDNN版本不兼容问题解决方案

2025-05-18 20:30:39作者：凌朦慧Richard

问题背景

在使用PyVideoTrans项目进行视频处理时，部分用户可能会遇到程序自动退出并报错"symbol lookup error libcudnn_cnn_infer.so.8: undefined symbol"的问题。这个错误通常与CUDA和cuDNN库的版本不兼容有关，特别是在Ubuntu 20.04系统环境下。

错误现象

用户在运行PyVideoTrans时，无论是否开启CUDA加速功能，程序都会自动退出并显示以下错误信息：

symbol lookup error: ../anaconda3/envs/pyvideotrans/lib/python3.10/site-packages/torch/lib/../../nvidia/cudnn/lib/libcudnn_cnn_infer.so.8: undefined symbol: _Z20traceback_iretf_implPKcRKN5cudnn16InternalStatus_tEb, version libcudnn_ops_infer.so.8

环境分析

从错误报告中可以看到，用户环境配置如下：

操作系统：Ubuntu 20.04
Python版本：3.10
NVIDIA驱动版本：535.129.03
CUDA版本：12.2（但nvcc显示11.6）
cuDNN版本：8.3.2
显卡型号：GTX 1660s

问题根源

这个错误的核心原因是CUDA工具包、cuDNN库和PyTorch版本之间的不兼容。具体表现为：

系统中安装了多个CUDA版本（nvcc显示11.6，而NVIDIA-SMI显示12.2）
cuDNN 8.3.2可能不完全兼容CUDA 12.2
PyTorch版本与CUDA/cuDNN版本不匹配

解决方案

方案一：统一CUDA版本

首先确认系统中实际使用的CUDA版本：
```
nvcc --version
```
和
```
echo $LD_LIBRARY_PATH
```
查看实际加载的CUDA库路径
建议统一使用CUDA 11.x系列，因为PyTorch对其支持更好

方案二：重新安装匹配的PyTorch版本

卸载现有PyTorch：

pip uninstall torch torchvision torchaudio

根据CUDA版本安装对应的PyTorch：

对于CUDA 11.x：

conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

对于CUDA 12.x：

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

方案三：安装必要的CUDA相关库

pip install nvidia-cublas-cu11 nvidia-cudnn-cu11

这个命令会安装与CUDA 11兼容的cuBLAS和cuDNN库，可能解决版本不匹配问题。

预防措施

在安装PyTorch时，务必选择与系统CUDA版本匹配的版本
保持CUDA驱动、工具包和cuDNN版本一致
使用虚拟环境隔离不同项目的依赖
定期检查并更新NVIDIA驱动

总结

PyVideoTrans项目中出现的这个CUDA/cuDNN兼容性问题，本质上是深度学习框架依赖管理中的常见问题。通过统一版本、重新安装匹配的PyTorch版本或补充安装必要的CUDA库，可以有效解决此类问题。对于深度学习开发者来说，维护一个版本一致的环境是保证项目稳定运行的关键。

pyvideotrans

Translate the video from one language to another and add dubbing. 将视频从一种语言翻译为另一种语言，并添加配音

项目地址：https://gitcode.com/gh_mirrors/py/pyvideotrans

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理