Fast-DDS中在ReaderListener回调中创建Writer导致的死锁问题分析

2025-07-01 15:02:27作者：房伟宁

The most complete DDS - Proven: Plenty of success cases.

项目地址：https://gitcode.com/gh_mirrors/fa/Fast-DDS

问题背景

在使用Fast-DDS的RTPS实现时，开发人员可能会遇到一个典型的死锁场景：当在ReaderListener的on_new_cache_change_added回调函数中尝试创建新的RTPSWriter时，系统会出现死锁。这种情况通常发生在需要动态创建发布者的场景中，比如实现命令-响应模式时。

死锁机制分析

这种死锁的产生源于Fast-DDS内部的多线程同步机制：

消息接收线程：当接收到新数据时，会获取Reader的互斥锁(mp_mutex)来处理消息
Writer创建过程：在创建Writer时，需要获取RTPSParticipantImpl的endpoints_list_mutex锁
匹配检查：同时，另一个线程可能正在执行端点匹配检查，此时会先获取endpoints_list_mutex的共享锁，再尝试获取Reader的mp_mutex锁

这样就形成了典型的AB-BA死锁模式：

线程1：持有Reader锁 → 等待Participant锁
线程2：持有Participant共享锁 → 等待Reader锁

Fast-DDS的设计考量

Fast-DDS的设计规范明确指出，ReaderListener的回调函数（如on_new_cache_change_added）应该仅用于处理接收到的数据变更，而不应该执行任何可能阻塞或需要获取其他锁的操作。这是因为：

回调函数执行在Fast-DDS的内部线程上下文中
在回调中执行复杂操作会影响整体性能
创建实体是重量级操作，可能涉及多种资源的分配和初始化

解决方案建议

对于需要在收到消息后动态创建发布者的场景，推荐采用以下架构模式：

异步处理机制：
- 在回调中仅将事件放入队列
- 使用独立线程从队列取出事件并执行实体创建
预创建模式：
- 在初始化阶段预先创建可能需要的所有发布者
- 按需激活/停用发布者
命令-响应模式优化：
- 为每个参与者预先创建专用的响应发布者
- 使用关联ID来匹配命令和响应

最佳实践

保持回调函数简洁高效
避免在回调中执行任何可能阻塞的操作
实体创建等重量级操作应放在应用主线程或专用线程中执行
对于动态发布需求，考虑使用预先分配+激活的模式

通过理解Fast-DDS的内部锁机制和设计原则，开发者可以避免这类死锁问题，构建更稳定高效的分布式系统。

The most complete DDS - Proven: Plenty of success cases.

项目地址：https://gitcode.com/gh_mirrors/fa/Fast-DDS

登录后查看全文

最新内容推荐

Windows版Redis 5.0.14下载资源：高效内存数据库的完美Windows解决方案 Python Django图书借阅管理系统：高效智能的图书馆管理解决方案 Python开发者的macOS终极指南：VSCode安装配置全攻略 Adobe Acrobat XI Pro PDF拼版插件：提升排版效率的专业利器 LabVIEW串口通信开发全攻略：从入门到精通的完整解决方案操作系统概念第六版PDF资源全面指南：适用场景与使用教程 STM32到GD32项目移植完全指南：从兼容性到实战技巧深入解析Windows内核模式驱动管理器：系统驱动管理的终极利器 Windows Server 2016 .NET Framework 3.5 SXS文件下载与安装完整指南基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter

Ascend Extension for PyTorch

ohos_react_native

React Native鸿蒙化仓库

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。