RAFT光学流模型显存不足问题分析与解决方案

2025-06-20 10:42:06作者：吴年前Myrtle

RAFT

项目地址：https://gitcode.com/gh_mirrors/raf/RAFT

RAFT是一种基于深度学习的光学流估计算法，由普林斯顿视觉与学习实验室开发。该算法在多项基准测试中表现出色，但在实际应用过程中，用户经常会遇到显存不足的问题。本文将深入分析这一问题，并提供有效的解决方案。

问题现象

当用户尝试在较高分辨率图像(如1440x2560)上运行RAFT模型时，系统会抛出"CUDA out of memory"错误。错误信息显示，即使显存总量为23.65GB，系统仍无法满足模型运行所需的12.36GB显存分配请求。

原因分析

特征图尺寸过大：RAFT模型在计算过程中会生成大量的特征图和相关体积(correlation volume)，这些数据结构会随着输入图像分辨率的增加而呈平方级增长。
相关性计算开销：RAFT使用4D相关性体积来计算特征点之间的匹配关系，这种计算方式对显存需求极高。
GPU架构限制：即使显存总量看似足够，由于内存碎片化和CUDA内核的并行执行需求，实际可用显存可能远小于理论值。

解决方案

1. 输入图像降采样

最直接有效的解决方案是降低输入图像的分辨率。通过保持宽高比的同时缩小图像尺寸，可以显著减少显存消耗。

def resize_frame(frame, target_height=480):
    """
    按比例缩放图像帧，保持宽高比，使高度接近目标高度
    参数:
        frame: 输入图像帧
        target_height: 目标高度
    返回:
        缩放后的图像帧
    """
    height, width, _ = frame.shape
    scale_percent = target_height / height
    new_width = int(width * scale_percent)
    resized_frame = cv2.resize(frame, (new_width, target_height), 
                             interpolation=cv2.INTER_AREA)
    return resized_frame