C3语言项目中OnStackAllocator容器溢出的ASAN错误分析

2025-06-17 21:51:13作者：冯爽妲Honey

问题背景

在C3语言项目(c3lang/c3c)的开发过程中，开发者在使用地址消毒器(AddressSanitizer)进行内存检查时，发现了一个关于OnStackAllocator的容器溢出问题。这个问题最初在c3tools的CI测试中被发现，表现为ASAN报告的container-overflow错误。

问题现象

当运行带有地址消毒器检查的测试时，程序会报告如下错误：

ERROR: AddressSanitizer: container-overflow on address 0x7ffed9e78820
READ of size 144 at 0x7ffed9e78820 thread T0

错误发生在std_collections_map $u l o n g$ std.core.mem.allocator.Allocation$.HashMap.set函数中，看起来像是内存访问越界。最初怀疑这与TrackingAllocator有关，因为当使用--test-noleak选项(禁用TrackingAllocator)时，问题消失。

深入调查

经过进一步分析，发现问题实际上与堆栈内存分配有关。在std.io.path.PathImp.walk函数中，使用了@stack_mem指令分配了512字节的堆栈内存用于文件操作。当处理深层嵌套的目录结构时，递归调用可能导致堆栈内存不足。

最小复现代码如下：

module mytest @test;
import std::math::random;
import std::io::path;

fn void test_path_walker()
{
    String path = ".";
    path::Path p = path::temp_new(path)!!;

    path::PathWalker fnwalk = fn bool! (Path p, bool is_dir, void* ctx) {
        return false;
    };
    p.walk(fnwalk, null)!!;
}

技术分析

问题的本质在于地址消毒器对堆栈内存的标记机制。当使用@stack_mem分配堆栈内存时，地址消毒器会"毒化"(poison)这部分内存区域，以防止越界访问。然而，在递归调用情况下，新的堆栈分配可能覆盖之前"毒化"的区域，而地址消毒器未能正确识别这种情况，导致误报。

具体表现为：

当处理嵌套目录结构时，递归调用path.walk函数
每次递归都会在堆栈上分配新的内存
地址消毒器错误地将这些操作识别为内存越界

解决方案

经过深入分析，确认这是一个地址消毒器的假阳性(false positive)报告。根本原因是地址消毒器对堆栈内存的"毒化"标记处理不当，特别是在递归调用场景下。

正确的处理方式是确保：

所有堆栈分配的内存在使用前都正确"去毒化"(unpoison)
递归调用时特别注意内存标记的传递

经验总结

这个案例提供了几个重要的经验教训：

地址消毒器虽然是强大的内存错误检测工具，但也可能产生假阳性报告
堆栈内存分配在递归场景下需要特别小心
理解底层内存管理机制对于调试复杂内存问题至关重要
最小复现案例对于定位问题根源非常有效

对于C3语言开发者来说，这个案例也提醒我们在设计内存分配器时需要充分考虑各种使用场景，特别是递归和嵌套调用情况下的内存管理问题。

c3c

Compiler for the C3 language

项目地址：https://gitcode.com/GitHub_Trending/c3/c3c

登录后查看全文