Slam-Toolbox中的线程安全与资源释放问题分析

2025-07-06 06:18:15作者：魏侃纯Zoe

问题背景

在ROS2的Slam-Toolbox项目中，存在一个潜在的线程安全问题，特别是在节点关闭期间。当使用AddressSanitizer工具运行时，会检测到"heap-use-after-free"错误，这表明在资源释放后仍有线程尝试访问这些资源。

问题现象

在节点关闭过程中，publishVisualizations()线程会继续运行并尝试访问已经被释放的资源。具体表现为：

线程T22尝试访问已被释放的karto::SensorManager实例
错误发生在OccupancyGrid::AddScan()方法中
资源由主线程T0释放，但工作线程仍在运行

技术分析

线程生命周期管理

Slam-Toolbox通过boost::thread创建了一个可视化发布线程，该线程执行publishVisualizations()方法。虽然代码中已经包含了join()调用以确保线程结束，但实际情况表明这并不总是有效。

根本原因

问题核心在于线程的退出条件判断：

while (rclcpp::ok()) {
    updateMap();
    // ...其他操作...
}

这种设计存在两个潜在问题：

rclcpp::ok()状态变化与资源释放顺序不确定
线程可能在检查rclcpp::ok()后、执行操作前被挂起，而此时资源已被释放

实验验证

通过插入延迟可以稳定复现该问题：

在循环内部插入5秒延迟会导致稳定的段错误
在循环外部插入延迟则不会出现问题这证实了线程确实可能在资源释放后继续执行操作。

解决方案

改进方案一：原子标志位

最直接的解决方案是引入原子标志位来控制线程退出：

std::atomic<bool> stop_visualization{false};

// 在析构函数中
stop_visualization = true;
visualization_thread_.join();

// 线程函数中
while (!stop_visualization) {
    // 工作代码
}

改进方案二：移除rclcpp依赖

考虑到项目已使用生命周期管理，可以完全移除对rclcpp::ok()的依赖，仅依靠原子标志位控制线程生命周期。

实现建议

在SlamToolbox类中添加原子标志位成员变量
修改publishVisualizations()的循环条件
确保在析构函数中正确设置标志位并等待线程结束
考虑添加额外的同步机制防止竞态条件

结论

多线程环境下的资源管理需要特别注意生命周期同步问题。在ROS2节点中，简单的rclcpp::ok()检查不足以保证线程安全退出。通过引入原子标志位等同步机制，可以更可靠地控制线程生命周期，避免资源访问冲突。这一改进不仅解决了当前的内存安全问题，也为项目的长期稳定性奠定了基础。

slam_toolbox

Slam Toolbox for lifelong mapping and localization in potentially massive maps with ROS

项目地址：https://gitcode.com/gh_mirrors/sl/slam_toolbox

登录后查看全文