RTABMap项目中设备位姿与相机位姿转换的技术解析

2025-06-26 05:30:09作者：戚魁泉Nursing

背景介绍

RTABMap是一个开源的实时外观定位与建图库，广泛应用于SLAM(同步定位与地图构建)领域。在iOS平台上，RTABMap会将采集到的传感器数据存储到SQLite3数据库中，包括相机图像、深度图、位姿信息以及相机标定参数等。

数据提取过程中的关键发现

开发者在处理RTABMap数据库时发现，直接从数据库中提取的位姿信息(opt_poses)与通过Open3D的ICP算法计算得到的位姿存在约2厘米的偏差。经过深入分析，发现这是由于设备位姿(device pose)与相机位姿(camera pose)之间的转换关系未被正确处理所致。

位姿转换原理

在RTABMap系统中，存在两个重要的坐标系转换关系：

设备位姿(Device Pose): 表示移动设备(如iPhone)在全局坐标系中的位置和姿态
相机位姿(Camera Pose): 表示相机在全局坐标系中的位置和姿态

这两者之间通过一个固定的变换矩阵相关联，这个矩阵就是相机标定数据中包含的设备到相机的变换矩阵。

正确的位姿转换方法

要从数据库中提取正确的相机位姿，需要执行以下步骤：

从"Data"表中提取相机标定数据，获取设备到相机的变换矩阵(通常记为T_device_camera)
从"Admin"表中提取优化后的位姿数据(opt_poses)，这是设备位姿
对每个设备位姿T_device_world，计算相机位姿： T_camera_world = T_device_world × T_device_camera

技术实现细节

在Python中，可以使用以下代码实现位姿转换：

def get_camera_poses(device_poses, device_to_camera_transform):
    """
    将设备位姿转换为相机位姿
    
    参数:
        device_poses: N个设备位姿的数组，每个是4x4齐次变换矩阵
        device_to_camera_transform: 设备到相机的固定变换矩阵(4x4)
    
    返回:
        camera_poses: 转换后的相机位姿数组
    """
    return np.matmul(device_poses, device_to_camera_transform)