NotACracker/COTR项目中的3D坐标系系统详解

2025-07-04 05:20:06作者：鲍丁臣Ursa

引言

在3D计算机视觉领域，坐标系系统的理解和统一是进行有效数据处理和模型训练的基础。NotACracker/COTR项目作为一个先进的3D视觉处理框架，采用了精心设计的坐标系系统来处理各种3D数据。本文将全面解析项目中使用的三种主要坐标系系统，帮助开发者更好地理解和使用该框架。

三种核心坐标系系统

1. 相机坐标系

相机坐标系是最常见的3D表示方式之一，广泛应用于基于视觉的3D感知任务中。

特征描述：

y轴正方向指向地面（垂直向下）
x轴正方向指向右侧（水平向右）
z轴正方向指向前方（垂直于成像平面）

              上  z 前
              |    ^
              |   /
              |  /
              | /
              |/
  左   ------ 0 ------> x 右
              |
              |
              |
              |
              v
            y 下

应用场景： 主要用于处理来自单目/双目相机、RGB-D相机等视觉传感器的数据。

2. 激光雷达坐标系

激光雷达坐标系是自动驾驶和机器人领域中常用的坐标系系统。

特征描述：

z轴负方向指向地面
x轴正方向指向前方
y轴正方向指向左侧

                z 上   x 前
                 ^    ^
                 |   /
                 |  /
                 | /
                 |/
  y 左   <------ 0 ------ 右

应用场景： 主要处理来自激光雷达(LiDAR)的点云数据，适用于自动驾驶环境感知等任务。

3. 深度坐标系

深度坐标系是专为深度学习和3D目标检测优化的坐标系系统。

特征描述：

z轴负方向指向地面
x轴正方向指向右侧
y轴正方向指向前方

             z 上   y 前
              ^    ^
              |   /
              |  /
              | /
              |/
  左   ------ 0 ------> x 右

应用场景： 适用于VoteNet、H3DNet等先进3D目标检测模型，特别优化了深度学习任务中的计算效率。

转向角(Yaw)的统一定义

在NotACracker/COTR项目中，转向角的定义遵循严格的数学规范：

右手坐标系原则：所有坐标系均为右手坐标系
角度增加方向：从重力轴负方向看，转向角沿逆时针方向增加
参考方向：x轴正方向始终作为0度参考方向

                     z 上  y 前 (yaw=0.5*pi)
                      ^    ^
                      |   /
                      |  /
                      | /
                      |/
左 (yaw=pi)    ------ 0 ------> x 右 (yaw=0)

实际应用示例： 当检测一辆汽车时，转向角表示车头方向与x轴正方向的夹角。0度表示车头朝右，90度表示车头朝前。

3D边界框的尺寸定义

边界框的尺寸解释与转向角密切相关：

dx：始终与框的主方向平行（转向角为0时与x轴平行）
dy：垂直于主方向的水平尺寸
dz：垂直尺寸（高度）

图示说明：

当yaw=0.5π时：

y 前
  ^      框的方向 (yaw=0.5*pi)
 /|\        ^
  |        /|\
  |     ____|____
  |    |    |    |
  |    |    |    | dx
__|____|____|____|______\ x 右
  |    |    |    |      /
  |    |    |    |
  |    |____|____|
  |         dy

当yaw=0时：

y 前
  ^     _________
 /|\   |    |    |
  |    |    |    |
  |    |    |    | dy
  |    |____|____|____\  框的方向 (yaw=0)
  |    |    |    |    /
__|____|____|____|_________\ x 右
  |    |    |    |         /
  |    |____|____|
  |         dx
  |