Actions Runner项目中ASan内存检测工具在Ubuntu 22.04环境下的段错误问题分析
在GitHub Actions的Runner项目中,近期发现了一个与AddressSanitizer(ASan)内存检测工具相关的严重问题。该问题表现为在Ubuntu 22.04环境下,使用ASan编译的简单C程序会随机出现段错误(Segmentation Fault),即使程序本身没有任何内存安全问题。
问题现象
当开发者在Ubuntu 22.04的GitHub Actions环境中使用clang编译器(版本14)配合ASan选项编译简单的C程序时,程序会在多次运行后随机出现段错误。一个典型的测试用例是编译一个仅包含printf语句的简单程序,使用以下编译选项:
clang-14 -O0 -g a.c -fsanitize=address -fsanitize-recover=address -o b
编译后的程序在连续多次运行时(如10次),有很大概率会出现段错误。这个问题在2024年3月10日发布的Ubuntu 22.04镜像中首次出现,而在3月4日的镜像中则表现正常。
问题根源
经过技术分析,这个问题与Linux内核的内存随机化机制有关。具体来说,是vm.mmap_rnd_bits这个内核参数的设置导致了ASan无法正常工作。ASan工具在实现内存检测时需要特定的内存布局,而默认的内存随机化设置可能干扰了ASan的正常工作。
解决方案
目前有两种可行的解决方案:
-
临时解决方案:在运行ASan检测的程序前,调整内核参数
sudo sysctl -w vm.mmap_rnd_bits=28这个命令会降低内存地址随机化的程度,使ASan能够正常工作。
-
长期解决方案:等待GitHub Actions团队更新Ubuntu 22.04的镜像版本,该问题已在后续的镜像更新中被修复。
技术背景
AddressSanitizer是LLVM/Clang提供的一种内存错误检测工具,它通过在编译时插入特殊代码来检测内存访问错误。ASan需要管理自己的内存映射区域,而Linux内核的内存地址随机化机制(ASLR)可能会与ASan的内存管理产生冲突。
vm.mmap_rnd_bits参数控制着mmap调用时地址随机化的位数。较大的值意味着更强的随机化,但同时也可能影响某些需要特定内存布局的工具(如ASan)的正常工作。将其设置为28是一个经验值,既能保持一定的安全性,又能让ASan正常工作。
影响范围
这个问题主要影响:
- 使用GitHub Actions的Ubuntu 22.04环境
- 使用ASan进行内存检测的C/C++项目
- 使用较新版本Runner镜像的项目
对于本地开发环境,如果遇到类似问题,同样可以采用调整vm.mmap_rnd_bits参数的方法来解决。
最佳实践
对于依赖ASan进行内存检测的项目,建议:
- 在CI/CD流程中添加对
vm.mmap_rnd_bits参数的检查 - 考虑在测试脚本中加入参数调整的命令
- 关注GitHub Actions镜像的更新日志,及时升级到已修复该问题的镜像版本
这个问题提醒我们,在使用高级内存检测工具时,需要考虑系统级配置可能带来的影响,特别是在CI/CD环境中,系统配置往往是标准化且不可轻易更改的。
kernelopenEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。C084
baihu-dataset异构数据集“白虎”正式开源——首批开放10w+条真实机器人动作数据,构建具身智能标准化训练基座。00
mindquantumMindQuantum is a general software library supporting the development of applications for quantum computation.Python056
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
GLM-4.7GLM-4.7上线并开源。新版本面向Coding场景强化了编码能力、长程任务规划与工具协同,并在多项主流公开基准测试中取得开源模型中的领先表现。 目前,GLM-4.7已通过BigModel.cn提供API,并在z.ai全栈开发模式中上线Skills模块,支持多模态任务的统一规划与协作。Jinja00
agent-studioopenJiuwen agent-studio提供零码、低码可视化开发和工作流编排,模型、知识库、插件等各资源管理能力TSX0135
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00