NNG项目中的IPC Use After Free问题分析与修复

2025-06-16 10:39:25作者：鲍丁臣Ursa

nanomsg-next-generation -- light-weight brokerless messaging

项目地址：https://gitcode.com/gh_mirrors/nn/nng

问题背景

在NNG项目的IPC通信模块中，发现了一个严重的Use After Free漏洞。该漏洞会导致进程崩溃，特别是在Windows平台上使用IPC通信时表现尤为明显。这个问题实际上是之前已报告问题的延续，之前的修复尝试未能彻底解决问题。

问题现象

当使用NNG的IPC通信时，特别是在请求-响应模式下，系统会出现以下异常行为：

ipc_send_cb回调函数在管道已经关闭后被调用
访问已释放的内存区域导致进程崩溃
客户端进程偶尔会出现段错误

从堆栈跟踪可以看出，崩溃发生在异步I/O操作已经被释放后仍然尝试访问该内存区域的情况下。

技术分析

深入分析该问题，我们发现根本原因在于Windows平台的I/O取消机制与NNG的管道关闭逻辑之间存在时序竞争。

在Windows平台上，当调用CancelIo函数取消I/O操作时，根据微软官方文档说明，所有被取消的I/O操作都会以ERROR_OPERATION_ABORTED错误完成，并且所有I/O操作的完成通知都会正常发生。这意味着即使调用了CancelIo，相关的完成回调函数仍会被至少调用一次。

这种机制导致了以下问题链：

管道关闭时，NNG尝试取消所有未完成的I/O操作
Windows平台仍然会触发这些被取消操作的完成回调
回调函数尝试访问已经被释放的资源
最终导致Use After Free崩溃

解决方案

针对这个问题，我们采取了以下修复措施：

在关闭管道前，增加对未完成I/O操作的等待机制
使用HasOverlappedIoCompleted函数进行忙等待，确保所有I/O操作确实完成
在回调函数中增加额外的状态检查，防止访问已释放资源

这种方案虽然会在Windows平台上增加少量的关闭开销，但能够确保资源的正确释放和避免Use After Free问题。

实现细节

修复的关键在于正确处理Windows平台的异步I/O完成机制。我们需要注意：

CancelIo不会立即终止所有I/O操作
完成回调可能在任何时候被调用，即使操作已被取消
资源释放必须等待所有可能的回调完成

通过引入适当的同步机制和状态检查，我们能够确保资源管理的安全性，同时保持系统的高性能特性。

结论

这个案例展示了跨平台开发中处理异步I/O操作时的常见陷阱。特别是在Windows平台上，I/O取消机制与其他平台有显著差异，需要特别注意。通过深入理解操作系统底层机制和仔细设计资源管理策略，我们能够构建出更健壮、更可靠的通信系统。

对于使用NNG进行IPC通信的开发人员来说，这个修复确保了在Windows平台上的稳定性和可靠性，特别是在高负载和频繁连接建立/关闭的场景下。

nanomsg-next-generation -- light-weight brokerless messaging

项目地址：https://gitcode.com/gh_mirrors/nn/nng

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理