CRoaring项目中的ART树迭代器栈溢出问题分析

2025-07-10 19:54:37作者：伍霜盼Ellen

问题背景

CRoaring是一个高性能的位图压缩库，在处理64位整数集合时使用了自适应基数树(ART)作为底层数据结构。最近在项目中发现了当ART树的深度超过6层时，会导致栈溢出错误。

问题现象

当构建一个深度超过6层的ART树结构后，调用roaring64_bitmap_get_cardinality函数计算基数时，程序会出现段错误。通过简化测试用例可以稳定复现这个问题：

roaring64_bitmap_t* bm = roaring64_bitmap_from(0);
for (int i = 0; i < 6; ++i) {
    uint64_t val = 1ULL << (i * 8 + 16);
    roaring64_bitmap_add(bm, val);
}
printf("cardinality = %d\n", (int)roaring64_bitmap_get_cardinality(bm));

技术分析

ART树结构

ART树是一种高效的内存索引结构，它通过压缩前缀和自适应节点大小来优化内存使用。在CRoaring的实现中，ART树用于存储64位整数键值对。

问题根源

问题出在ART树的迭代器实现上。迭代器使用了一个固定大小的栈结构来跟踪遍历路径：

typedef struct {
    art_iterator_frame frames[6];  // 固定大小的栈
    int frame;                     // 当前栈深度
} art_iterator;

当树的深度超过6层时，迭代器在向下遍历时会尝试访问超出栈范围的帧，导致栈缓冲区溢出。具体发生在art_iterator_down函数中：

static inline void art_iterator_down(art_iterator* iterator,
                                    const art_node* node) {
    iterator->frame++;
    iterator->frames[iterator->frame].node = node;  // 当frame>=6时越界
}

调试信息

通过调试工具可以观察到，当插入6个特定模式的键值后，ART树会形成一个深度为7的结构：

这种结构导致迭代器需要7层栈帧来遍历，但实现中只预留了6层。

解决方案

临时解决方案

目前可以通过以下方式规避问题：

避免创建深度超过6层的ART树结构
在调用基数计算前进行深度检查

长期修复

需要修改迭代器实现，可以考虑：

增加栈帧数组的大小
改为动态分配栈空间
实现迭代器的深度限制检查

影响评估

此问题影响所有使用64位Roaring位图并且可能构建深度超过6层ART树的应用场景。特别是在处理特定模式的连续键值时容易触发。

最佳实践建议

开发人员在使用CRoaring的64位位图功能时，应当：

注意键值的分布模式
在关键操作前进行数据验证
考虑使用32位位图替代64位位图（如果数据范围允许）

这个问题提醒我们在实现树形结构迭代器时，必须仔细考虑最大深度限制，并为可能的深度扩展预留足够空间。

CRoaring

Roaring bitmaps in C (and C++), with SIMD (AVX2, AVX-512 and NEON) optimizations: used by Apache Doris, ClickHouse, and StarRocks

项目地址：https://gitcode.com/gh_mirrors/cr/CRoaring

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781

CRoaring项目中的ART树迭代器栈溢出问题分析

问题背景

问题现象

技术分析

ART树结构

问题根源

调试信息

解决方案

临时解决方案

长期修复

影响评估

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

CRoaring项目中的ART树迭代器栈溢出问题分析

问题背景

问题现象

技术分析

ART树结构

问题根源

调试信息

解决方案

临时解决方案

长期修复

影响评估

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选