whisper.cpp项目HIPBLAS编译问题分析与解决方案

2025-05-03 01:26:40作者：牧宁李

问题背景

在使用whisper.cpp项目进行AMD GPU加速编译时，开发者遇到了两个主要问题：

使用make命令编译时，HIPBLAS选项被忽略，导致最终编译为CPU版本
使用cmake编译时，出现whisper_mel_calc_create_cuda未定义的链接错误

这些问题出现在Pop OS 22.04系统环境下，使用ROCm 6.1.0和AMD RX 7900XT显卡的配置中。

技术分析

HIPBLAS编译机制

whisper.cpp项目支持多种硬件加速后端，包括CUDA和HIPBLAS。HIPBLAS是AMD提供的ROCm平台上的BLAS库实现，用于在AMD GPU上加速线性代数运算。

项目通过条件编译来控制不同后端的启用。在Makefile和CMake配置中，通过WHISPER_HIPBLAS宏来区分不同的编译路径。

问题根源

make编译问题：Makefile中条件判断逻辑可能存在问题，导致HIPBLAS选项未被正确识别和处理。
cmake链接错误：这是由于PR #2206引入的CUDA mel计算功能与HIPBLAS编译产生了冲突。在HIPBLAS模式下，不应该包含CUDA特定的mel计算实现，但条件编译宏没有正确排除这部分代码。

解决方案

make编译修复

修改Makefile中whisper-mel-cuda.o的位置，将其移动到CUDA条件判断块内：

ifdef WHISPER_CUDA
...
whisper-mel-cuda.o: whisper.cpp whisper.h
	$(NVCC) $(NVCCFLAGS) -c $< -o $@
endif

代码条件编译修复

在whisper.cpp中，修改mel计算相关的条件编译宏：

#if GGML_USE_CUDA && !defined(GGML_USE_HIPBLAS)

这样确保在HIPBLAS模式下不会编译CUDA特定的mel计算实现。

验证方法

修复后，可以使用以下命令验证编译是否成功：

make clean
WHISPER_HIPBLAS=1 make -j8

或者使用cmake方式：

CXX=hipcc CC=hipcc cmake -B build -DWHISPER_HIPBLAS=ON -DAMDGPU_TARGETS="gfx1100" -DBUILD_SHARED_LIBS=ON
cmake --build build -j --config Release

技术建议

对于AMD GPU用户，建议优先使用ROCm 6.1或更高版本，以获得最佳的HIPBLAS支持。
在编译前，确保系统已正确安装ROCm工具链和HIPBLAS库。
如果遇到类似问题，可以回退到已知能正常工作的提交（如af5833e），作为临时解决方案。
对于开发者，建议在添加新的硬件加速功能时，考虑所有支持的后端兼容性，并添加相应的条件编译保护。

通过以上修改，开发者可以成功在AMD GPU平台上编译并使用whisper.cpp的HIPBLAS加速功能，显著提升语音处理性能。

whisper.cpp

Port of OpenAI's Whisper model in C/C++

项目地址：https://gitcode.com/GitHub_Trending/wh/whisper.cpp

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

471

481

cann-learning-hub

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

157

249

whisper.cpp项目HIPBLAS编译问题分析与解决方案

问题背景

技术分析

HIPBLAS编译机制

问题根源

解决方案

make编译修复

代码条件编译修复

验证方法

技术建议

热门内容推荐

最新内容推荐

项目优选

whisper.cpp项目HIPBLAS编译问题分析与解决方案

问题背景

技术分析

HIPBLAS编译机制

问题根源

解决方案

make编译修复

代码条件编译修复

验证方法

技术建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选