Salsa项目中的Memo成分索引优化方案

2025-07-02 15:04:35作者：尤峻淳Whitney

背景介绍

Salsa是一个用于增量计算的Rust框架，它能够智能地跟踪计算依赖关系并仅重新计算必要部分。在Salsa的当前实现中，每个被跟踪函数都会获得一个全局唯一的MemoIngredientIndex索引，这些索引用于访问附加到Salsa结构上的备忘录表。

问题分析

现有的实现存在一个效率问题：虽然每个函数都被分配了全局唯一的索引，但实际上每个函数只能附加到特定类型的Salsa结构上。这意味着索引只需要在单个Salsa结构内部保持唯一性，而不需要在全局范围内保持唯一。这种过度设计导致了在大型项目中会浪费大量内存空间。

技术细节

当前实现的核心数据结构是一个简单的向量：

memo_ingredient_indices: RwLock<Vec<IngredientIndex>>

其中存储的是将被用来存储备忘录的函数成分索引。这种设计虽然简单，但不够高效。

优化方案

数据结构重构

建议将其重构为一个映射表结构：

memo_ingredient_indices: RwLock<Map<IngredientIndex, Vec<IngredientIndex>>>

这个映射表以Salsa结构成分索引为键，值为该结构上所有被跟踪函数的成分索引列表。这样设计可以显著减少内存使用量，特别是在包含大量Salsa结构和跟踪函数的大型项目中。

调用方适配

Salsa宏规则生成的代码需要相应修改，以传递函数所附加的Salsa结构的成分索引。同时，tracked_struct.rs中的调用方也需要更新以传递正确的self.ingredient_index。

性能影响

这种优化将带来以下好处：

显著减少内存使用量，特别是在大型项目中
保持相同的功能性和正确性
对性能影响极小，因为只是改变了索引的存储方式而非计算逻辑

实现考虑

在实现过程中需要注意：

线程安全性：使用RwLock确保并发访问安全
向后兼容性：确保修改不会破坏现有API
文档更新：清晰记录新的数据结构设计

总结

通过对Salsa中Memo成分索引存储方式的优化，可以显著提高框架在大型项目中的内存效率。这种优化体现了良好的软件设计原则：只在必要范围内保持唯一性，避免不必要的全局状态。对于使用Salsa框架开发大型增量计算应用的团队来说，这项优化将带来切实的性能提升。

salsa

A generic framework for on-demand, incrementalized computation. Inspired by adapton, glimmer, and rustc's query system.

项目地址：https://gitcode.com/gh_mirrors/sa/salsa

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解