whisper.cpp项目在RTX 5080显卡上的CUDA编译问题解析

2025-05-03 14:34:05作者：董灵辛Dennis

在whisper.cpp项目中启用CUDA支持进行编译时，开发者可能会遇到一个常见的编译错误："nvcc fatal: Unsupported gpu architecture 'compute_120'"。这个问题通常出现在使用较新NVIDIA显卡（如RTX 5080）进行编译时。

问题背景

当使用CMake配置whisper.cpp项目并启用CUDA支持时，系统会自动检测CUDA架构。在某些情况下，特别是使用较新的NVIDIA显卡时，自动检测可能无法正确识别显卡的计算能力版本，导致编译器尝试使用不支持的架构版本（如compute_120）。

错误表现

编译过程中会出现类似以下错误信息：

nvcc fatal: Unsupported gpu architecture 'compute_120'

这表明NVIDIA的CUDA编译器(nvcc)无法识别或支持指定的计算能力版本。

解决方案

针对这个问题，最直接的解决方法是手动指定正确的CUDA架构版本。对于RTX 5080显卡，可以明确指定架构版本为86（即Ampere架构的计算能力8.6）：

cmake -B build -DGGML_CUDA=1 -DCMAKE_CUDA_ARCHITECTURES="86"
cmake --build build -j --config Release

技术原理

CUDA架构版本：NVIDIA显卡的计算能力用"sm_XX"表示，其中XX代表架构版本号。例如，sm_86代表Ampere架构的计算能力8.6。
自动检测问题：CMake的自动检测机制可能无法正确识别最新显卡的架构版本，特别是当CUDA工具包版本与显卡发布之间存在时间差时。
手动指定的优势：明确指定架构版本可以确保编译器生成针对特定显卡优化的代码，同时避免尝试编译不支持的架构版本。

最佳实践

在编译前，建议查询显卡的具体计算能力版本。可以通过NVIDIA官方文档或运行nvidia-smi命令获取相关信息。
对于不同的NVIDIA显卡，需要指定对应的架构版本。常见的有：
- 图灵架构：75
- Ampere架构：80/86
- Ada Lovelace架构：89
在团队开发环境中，建议将正确的架构版本写入项目的构建脚本或文档中，确保所有开发者使用一致的配置。

总结

在whisper.cpp项目中使用CUDA加速时，遇到架构版本不支持的编译错误是常见现象。通过理解CUDA架构版本的概念，并掌握手动指定架构版本的方法，开发者可以轻松解决这类问题，充分发挥最新NVIDIA显卡的性能优势。

whisper.cpp

Port of OpenAI's Whisper model in C/C++

项目地址：https://gitcode.com/GitHub_Trending/wh/whisper.cpp

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

457

439

flutter_flutter

用户可使用该项目在 OpenHarmony 平台开发应用，支持通过 IDE 或终端用 Flutter Tools 指令编译构建，基于 Flutter 3.27.4 版本，新增 impeller-vulkan 渲染模式，兼容多种开发指令与环境配置。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Python

998

609

whisper.cpp项目在RTX 5080显卡上的CUDA编译问题解析

问题背景

错误表现

解决方案

技术原理

最佳实践

总结

相关内容推荐

热门内容推荐

项目优选