gperftools项目中mmap_hook_test在aarch64架构下的断言失败问题分析

2025-05-26 03:45:45作者：廉皓灿Ida

在gperftools 2.15.90版本中，开发人员发现了一个在aarch64架构下持续出现的测试失败问题。这个问题出现在mmap_hook_test测试用例中，具体表现为断言evt.stack_depth == 1失败。

问题现象

当在aarch64架构上运行make check时，mmap_hook_test测试用例会稳定地失败。测试日志显示，在MMapHookTest.MMap测试中，程序断言evt.stack_depth == 1失败，导致测试非正常终止。

问题根源

经过深入分析，这个问题源于gperftools中mmap hook回调机制的递归调用问题。具体来说：

mmap hook会调用堆栈回溯功能
堆栈回溯功能会调用libunwind库
libunwind在初始化内部数据结构时会调用mmap
这种递归调用触发了gperftools中防止递归的特殊处理机制

gperftools原本对这种递归情况有特殊处理，会显式提供一个空的回溯栈来避免进入回溯功能的递归调用。然而测试用例并没有预期到这种情况，因此断言失败。

解决方案

考虑到gperftools未来的发展方向，开发人员计划：

短期内：修改测试用例使其对这种特殊情况更加宽容
长期来看：随着heap checker功能的移除，也将移除mmap/sbrk hooks以及包含mmap事件的堆"profiling"特性，从根本上解决这个问题

技术启示

这个问题揭示了在系统级工具开发中几个重要的技术考量：

递归调用的处理：在涉及系统调用的hook机制中，必须谨慎处理可能引发的递归调用
测试用例设计：测试用例需要考虑系统实现的各种边界情况，包括递归等特殊情况
架构差异：不同硬件架构下的行为差异需要在测试中得到充分考虑

这个问题也提醒我们，在开发系统级工具时，对底层系统调用的hook需要特别小心，必须全面考虑各种可能的调用路径和递归情况。

影响范围

该问题主要影响：

使用aarch64架构的系统
启用了mmap hook功能的场景
需要精确堆栈回溯深度的应用场景

对于大多数用户来说，这个问题不会影响gperftools的核心内存管理功能，主要影响的是相关的测试用例和特定的profiling功能。

gperftools

Main gperftools repository

项目地址：https://gitcode.com/gh_mirrors/gp/gperftools

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。