SAPIENS项目中的Hi4D数据集评估协议解析

2025-06-09 05:41:03作者：秋阔奎Evelyn

评估流程概述

在SAPIENS项目中，Hi4D数据集被用于评估多人体姿态估计和三维重建的性能。评估过程主要关注两个关键指标：表面法线预测精度和深度估计准确性。

表面法线评估方法

表面法线评估采用全帧输入方式，无需对图像进行裁剪处理。评估脚本会计算预测法线与真实法线之间的角度误差，并生成以下指标：

平均角度误差（angular_error_mean）
中值角度误差（angular_error_median）
11.5度以内准确率（within_11_point_5_deg）
22.5度以内准确率（within_22_point_5_deg）
30度以内准确率（within_30_deg）

评估过程首先将法线向量归一化为单位向量，然后计算点积并转换为角度误差。评估脚本支持多线程处理，可显著提高评估效率。

深度评估方法

由于模型预测的是相对深度值，评估时需要计算尺度(scale)和平移(shift)参数来转换为绝对深度。这一过程通过求解线性方程组实现：

构建系统矩阵A和右侧向量b
计算行列式det = a00a11 - a01a01
当det>0时，系统有解，计算尺度x0和平移x1

这种方法确保了深度预测与真实值在最优尺度和平移下进行比较，从而得到更准确的评估结果。

实现细节

评估代码采用了RunningAverage和RunningAverageDict类来实时计算和更新指标平均值。对于法线评估，处理流程包括：

加载真实法线数据(.npy格式)和掩码图像(.png格式)
加载预测法线数据
在掩码区域内计算误差指标
并行处理所有测试图像

深度评估的关键函数compute_scale_and_shift实现了最小二乘优化，确保预测深度与真实深度在最佳线性变换下对齐。

性能优化

评估脚本采用了多线程并行处理技术(ThreadPoolExecutor)，显著提高了大规模数据集的评估效率。对于Hi4D这样的多人体数据集，这种优化尤为重要。

实际应用建议

在实际使用中，开发者应注意：

确保输入图像格式与评估脚本要求一致
检查掩码图像的正确性，避免评估无效区域
对于深度评估，验证尺度和平移计算的数值稳定性
考虑使用与论文相同的评估协议以保证结果可比性

通过遵循这些评估协议，研究人员可以准确衡量模型在Hi4D数据集上的性能，并进行公平的算法比较。

sapiens

High-resolution models for human tasks.

项目地址：https://gitcode.com/gh_mirrors/sa/sapiens

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

134

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN开源社区的核心管理仓库，包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息

555

110