TensorRT自定义插件中workspace参数为null的解决方案

2025-05-20 15:49:21作者：江焘钦

NVIDIA® TensorRT™ is an SDK for high-performance deep learning inference on NVIDIA GPUs. This repository contains the open source components of TensorRT.

项目地址：https://gitcode.com/GitHub_Trending/tens/TensorRT

问题背景

在使用TensorRT 10和CUDA 11.6开发自定义插件时，开发者遇到了一个常见但容易被忽视的问题：在插件enqueue函数中，传入的workspace参数为null。这种情况会导致插件无法正常工作，特别是在需要临时内存空间进行计算的场景下。

问题分析

在TensorRT的插件开发中，workspace是一个重要的参数，它提供了插件执行时所需的临时内存空间。当这个参数为null时，通常意味着插件没有正确声明所需的工作空间大小。

通过对比TensorRT示例代码sample_non_zero_plugin可以发现，该问题通常与插件类的实现方式有关。在TensorRT 10中，插件接口有了较大变化，开发者需要特别注意新接口的要求。

解决方案

1. 实现getWorkspaceSize方法

对于继承自IPluginV3、IPluginV3OneCore、IPluginV3OneBuild和IPluginV3OneRuntime的插件类，必须实现以下方法：

size_t getWorkspaceSize(DynamicPluginTensorDesc const* inputs, 
                       int32_t nbInputs,
                       DynamicPluginTensorDesc const* outputs, 
                       int32_t nbOutputs) const noexcept override;

这个方法需要返回插件执行时所需的临时内存空间大小（以字节为单位）。TensorRT会根据这个返回值分配workspace内存，并在enqueue函数中传递正确的指针。

2. 计算工作空间大小

在getWorkspaceSize方法中，开发者需要根据输入输出张量的形状和插件算法的需求，准确计算所需的工作空间大小。例如：

size_t FpsamplePlugin::getWorkspaceSize(DynamicPluginTensorDesc const* inputs, 
                                       int32_t nbInputs,
                                       DynamicPluginTensorDesc const* outputs, 
                                       int32_t nbOutputs) const noexcept {
    // 确保输入输出数量符合预期
    assert(nbInputs == m_in_n);
    assert(nbOutputs == m_out_n);

    // 获取输入张量的形状信息
    const Dims& inputDims = inputs[0].desc.dims;
    
    // 计算所需的工作空间大小
    int b = inputDims.d[0];  // batch size
    int n = inputDims.d[1];  // number of points
    
    size_t tempSize = b * n * sizeof(float);  // 临时浮点数组
    size_t idxsSize = b * m_nsample * sizeof(int);  // 临时索引数组
    
    return tempSize + idxsSize;  // 总工作空间大小
}

3. 在enqueue中使用工作空间

正确实现getWorkspaceSize后，enqueue函数中的workspace参数将不再为null，开发者可以安全地使用这块内存：

int32_t FpsamplePlugin::enqueue(const PluginTensorDesc* inputDesc,
                               const PluginTensorDesc* outputDesc,
                               const void* const* inputs,
                               void* const* outputs,
                               void* workspace,
                               cudaStream_t stream) noexcept {
    // 现在workspace参数已经有效
    float* temp = static_cast<float*>(workspace);
    // 使用工作空间进行计算...
}