WasmEdge在Jetson设备上构建GGML CUDA插件的问题解析

2025-05-25 09:43:17作者：温艾琴Wonderful

背景介绍

WasmEdge是一个高性能的WebAssembly运行时环境，它支持在边缘计算设备上运行WebAssembly模块。在Jetson这类ARM架构的边缘计算设备上，用户经常希望利用CUDA加速来提升AI推理性能。然而，WasmEdge官方预构建的GGML CUDA插件目前并不支持Jetson设备上的aarch64架构。

问题本质

当用户在Jetson设备（如NVIDIA Jetson开发者套件）上运行WasmEdge安装脚本时，系统会尝试下载一个名为"WasmEdge-plugin-wasi_nn-ggml-cuda-11-0.14.1-ubuntu20.04_aarch64.tar.gz"的插件包。但由于官方资源库中缺少针对Jetson设备的预构建版本，导致安装失败。

解决方案

由于官方尚未提供预构建的aarch64+CUDA11插件包，用户需要自行从源代码构建。以下是详细的构建步骤和技术要点：

1. 环境准备

确保Jetson设备已安装：

Ubuntu 20.04操作系统
适当版本的CUDA工具包（11.x）
基本的构建工具链（cmake, ninja等）

2. 关键构建参数

构建过程中需要特别注意以下参数设置：

export CUDAARCHS=72  # 根据具体Jetson型号调整
export CXXFLAGS="-Wno-error"  # 忽略某些编译警告

其中CUDAARCHS参数需要根据Jetson的具体型号进行调整，常见值包括：

Jetson Xavier系列：72
Jetson Orin系列：87

3. 完整构建脚本

以下是经过验证的完整构建脚本：

_BUILD_NUMBER="b4067"
_OUTPUT_PREFIX="build"
_ARCH="aarch64"
_OUTPUT_NAME="WasmEdge-plugin-wasi_nn-ggml-cuda-0.14.1-ubuntu20.04_aarch64.tar.gz"
_OUTPUT_DIR="${_OUTPUT_PREFIX}/plugins/wasi_nn"
_CMAKE_OPTIONS="-DWASMEDGE_PLUGIN_WASI_NN_BACKEND=GGML -DWASMEDGE_PLUGIN_WASI_NN_GGML_LLAMA_BLAS=OFF -DWASMEDGE_PLUGIN_WASI_NN_GGML_LLAMA_CUBLAS=ON"
_TAR_NAMES="wasi_nn-ggml"
_OUTPUT_BIN="libwasmedgePluginWasiNN.so"

# 清理并创建构建目录
rm -rf ${_OUTPUT_PREFIX}

# 执行构建
cmake -B${_OUTPUT_PREFIX} -GNinja \
    -DCMAKE_CUDA_COMPILER=/usr/local/cuda/bin/nvcc \
    -DCMAKE_BUILD_TYPE=Release \
    -DWASMEDGE_BUILD_AOT_RUNTIME=OFF \
    -DWASMEDGE_USE_LLVM=OFF \
    -DWASMEDGE_BUILD_TOOLS=OFF \
    ${_CMAKE_OPTIONS}
cmake --build ${_OUTPUT_PREFIX}

# 打包生成插件
cp -f ${_OUTPUT_DIR}/${_OUTPUT_BIN} ${_OUTPUT_BIN}
tar -zcvf plugin_${_TAR_NAMES}.tar.gz ${_OUTPUT_BIN}
mv plugin_${_TAR_NAMES}.tar.gz ${_OUTPUT_NAME}