LuaJIT JIT编译中递归返回导致的栈槽溢出问题分析

2025-06-09 07:52:03作者：贡沫苏Truman

问题背景

在LuaJIT的即时编译(JIT)过程中，当处理递归函数返回并生成侧边追踪(side trace)时，存在一个潜在的栈槽(slot)溢出风险。这个问题主要出现在以下场景中：

递归函数返回大量值
紧接着调用另一个函数
JIT编译器尝试记录这些操作时

技术细节

LuaJIT的JIT编译器在记录字节码执行时会使用虚拟的JIT栈槽来跟踪值的流动。每个函数调用、返回操作都会影响当前使用的栈槽数量。系统预设了一个最大栈槽限制LJ_MAX_JSLOTS来防止资源耗尽。

在特定情况下，当递归函数返回大量值后立即调用另一个函数，JIT编译器在记录这些操作时可能会：

先记录递归函数返回的大量值
然后准备记录函数调用
在这个过程中没有正确检查总的栈槽使用量

这会导致栈槽数量超过LJ_MAX_JSLOTS限制，触发断言失败。

问题复现

通过构造特定的Lua代码可以复现这个问题：

创建一个递归函数，返回大量值(如30个字符串)加上递归调用自身
创建另一个函数，声明大量局部变量(如100个)
在这个函数中调用递归函数
启用JIT编译执行

当JIT编译器尝试记录这些操作时，由于返回值和局部变量占用了过多栈槽，最终导致断言失败。

解决方案

修复方案是在记录返回操作时增加栈槽溢出检查。具体修改包括：

在lj_record.c文件的lj_record_ret函数中
增加对当前已使用栈槽(J->baseslot + J->maxslot)的检查
如果超过LJ_MAX_JSLOTS限制，抛出栈溢出错误

这个修改确保了在任何情况下都不会超出预设的栈槽限制，从而避免了断言失败。

技术影响

这个问题虽然需要特定条件才能触发，但对于以下情况可能有影响：

使用深度递归并返回大量值的函数
在递归调用附近有大量局部变量的函数
使用JIT编译的复杂算法实现

修复后，LuaJIT能够更安全地处理这类边缘情况，提高了JIT编译器的稳定性。

最佳实践

为避免类似问题，开发者应该：

避免在递归函数中返回过多值
注意局部变量的数量控制
对于性能关键代码，考虑手动优化递归为迭代
在复杂算法实现中，适当分割函数功能

这个修复已合并到LuaJIT 2.1和2.0版本中，建议用户及时更新以获得更稳定的JIT编译体验。

LuaJIT

Mirror of the LuaJIT git repository

项目地址：https://gitcode.com/gh_mirrors/lu/LuaJIT

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.1 K

611

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。