DeepLabCut视频分析中空帧处理的优化方案

2025-06-09 02:52:49作者：尤峻淳Whitney

项目地址：https://gitcode.com/gh_mirrors/dee/DeepLabCut

问题背景

在计算机视觉领域，动物姿态估计是一个重要研究方向。DeepLabCut作为一款开源的动物行为分析工具，在科研领域得到了广泛应用。近期在使用DeepLabCut 3.0.0 rc4版本进行多动物姿态分析时，发现了一个与空帧处理相关的技术问题。

问题现象

当分析视频中存在大量无动物的空帧时，模型可能无法检测到任何关键点坐标。这种情况下，预测结果中的confidence和coordinates数组会返回空值（shape为(0,)的数组）。在后续的组装过程中，assembler._assemble()方法会返回None值，导致程序在尝试迭代None值时抛出NoneType错误。

技术细节

问题出现在paf_predictor.py文件的预测结果后处理阶段。核心代码段如下：

assemblies, unique = self.assembler._assemble(data_dict, ind_frame=0)
for j, assembly in enumerate(assemblies):
    poses[i, j, :, :4] = torch.from_numpy(assembly.data)
    poses[i, j, :, 4] = assembly.affinity

当输入帧中无动物时，assemblies变量会被赋值为None，而后续的for循环没有对此情况进行处理，导致程序崩溃。

解决方案

针对这一问题，开发团队已经提出了修复方案。核心思路是在迭代assemblies前增加空值检查：

assemblies, unique = self.assembler._assemble(data_dict, ind_frame=0)
if assemblies is not None:
    for j, assembly in enumerate(assemblies):
        poses[i, j, :, :4] = torch.from_numpy(assembly.data)
        poses[i, j, :, 4] = assembly.affinity