Wasmi项目中的CallStack实例处理优化

2025-07-09 07:56:24作者：申梦珏Efrain

在WebAssembly解释器Wasmi的最新优化中，开发团队针对CallStack中的Instance处理进行了重要改进，显著减少了内存使用并提升了性能。

优化背景

在WebAssembly执行过程中，CallStack负责管理函数调用栈帧。原先的设计中，每个CallFrame都包含一个Instance引用，用于标识当前执行的Wasm实例。每个Instance占用8字节内存，当调用栈较深时，这会带来可观的内存开销。

问题分析

经过分析发现，这种设计实际上是为Instance频繁切换的场景优化的，但在实际应用中，Instance切换是相对罕见的情况，通常只发生在调用由其他Wasm实例提供的导入函数时。大多数情况下，整个调用链都在同一个Instance中执行。

优化方案

新方案采用了更智能的数据结构设计：

struct CallStack {
    frames: Vec<CallFrame>,
    instances: Vec<(usize, Instance)>,
}

其中关键改进点包括：

移除了CallFrame中的Instance字段
新增instances向量，存储(索引, Instance)对
索引表示该Instance生效的调用深度

工作原理

初始状态下，CallStack包含：

一个初始CallFrame
一个初始Instance记录，表示在调用深度0时使用的Instance

当压入新CallFrame时：

如果Instance不变，不做任何操作
如果Instance改变，记录新Instance及其生效的调用深度

当弹出CallFrame时：

检查是否与instances中记录的深度匹配
如果匹配，同时弹出Instance记录

API设计

新设计提供了清晰的接口：

impl CallStack {
    // 压入新CallFrame，返回Instance变更情况
    pub fn push(&mut self, frame: CallFrame, instance: Option<Instance>) -> Option<Instance> { ... }
    
    // 弹出CallFrame，返回可能的Instance变更
    pub fn pop(&mut self) -> (CallFrame, Option<Instance>) { ... }
}