Rust Miri 解释器中函数指针转换导致内存泄漏问题分析

2025-06-09 11:57:32作者：翟萌耘Ralph

在 Rust 的 Miri 解释器项目中，最近发现了一个关于函数指针转换操作导致内存使用量无限制增长的问题。这个问题虽然在实际应用中可能不会立即显现，但对于解释器的长期稳定运行构成了潜在威胁。

问题现象

当程序在循环中反复将函数转换为函数指针类型时，Miri 解释器的内存使用量会以每分钟约1GB的速度持续增长。这种内存泄漏现象在以下简单代码中即可复现：

fn main() {
    loop {
        oof as fn(); // 使用oof as usize也会产生同样效果
    }
}

fn oof() {}

技术背景

这个问题源于 Miri 解释器在处理函数指针转换时的实现机制。每次执行函数到函数指针的转换操作时，解释器都会创建一个新的内存表示，而没有重用之前已经创建过的结果。对于循环中的重复操作，这种设计导致了内存分配的持续累积。

类似的问题在泛型函数的情况下其实早已存在，只是最近的一个改动使得这个现象在非泛型函数中也变得明显。

解决方案思路

解决这个问题的关键在于引入缓存机制。我们可以借鉴 Miri 解释器在处理常量表达式时采用的缓存策略，即让相同的函数指针转换操作返回固定的内存地址，而不是每次都创建新的表示。

具体来说，可以为每个函数维护一个有限的地址集合，当需要将该函数转换为函数指针时，从这个集合中选择一个固定的地址返回。这种方法既能保证语义正确性，又能有效控制内存增长。

技术影响

这种内存泄漏问题虽然不会立即导致程序崩溃，但对于需要长时间运行的场景（如持续集成测试或复杂程序验证）会构成严重威胁。内存的无限制增长最终可能导致系统资源耗尽，影响整个测试流程的稳定性。

通过实现函数指针转换结果的缓存，不仅可以解决当前的内存泄漏问题，还能为解释器的整体性能带来提升，减少不必要的内存分配和回收操作。

实现考量

在实现缓存机制时，需要考虑以下几个技术细节：

缓存的生命周期管理：确保缓存在适当的时候被清理，避免长期持有不再需要的资源
线程安全性：如果 Miri 支持多线程执行，缓存机制需要保证线程安全
内存效率：缓存结构本身不应该引入过多的内存开销

这个问题再次提醒我们，在解释器设计中，对于频繁执行的简单操作也需要特别关注其资源管理策略，即使是看似无害的类型转换操作也可能在循环中产生累积效应。

miri

An interpreter for Rust's mid-level intermediate representation

项目地址：https://gitcode.com/gh_mirrors/mi/miri

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

pytorch

Ascend Extension for PyTorch

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.03 K

481

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。

openGauss kernel ~ openGauss is an open source relational database management system

C++

158

210