Salsa项目中的粗粒度跟踪结构体设计变更

2025-07-02 00:55:42作者：何举烈Damon

A generic framework for on-demand, incrementalized computation. Inspired by adapton, glimmer, and rustc's query system.

项目地址：https://gitcode.com/gh_mirrors/sa/salsa

背景介绍

Salsa是一个用于增量计算的Rust框架，它通过跟踪数据依赖关系来实现高效的重新计算。在Salsa的设计中，跟踪结构体(Tracked Struct)是一个核心概念，它允许开发者定义那些需要被Salsa跟踪的数据结构。

原有设计的问题

在原有实现中，Salsa跟踪结构体的字段默认都是被独立跟踪的，除非开发者显式地使用#[id]属性标记某些字段。这种设计存在两个主要问题：

默认行为不合理：大多数情况下，结构体的某些字段（如标识字段）实际上不需要被独立跟踪，因为它们的变化会自然导致整个结构体实例被视为"不同"的对象。
性能开销：所有字段（包括标识字段）都被同等对待，导致不必要的跟踪开销，因为这些标识字段的变更实际上应该触发整个结构体的重新创建。

设计变更方案

新的设计方案将反转默认行为：

默认不跟踪：现在字段默认不会被独立跟踪，除非显式标记为#[salsa::tracked]。
区分字段访问：对于非跟踪字段（原#[id]字段），采用更轻量级的访问方式，避免不必要的跟踪开销。

技术实现细节

宏层面的修改

在Salsa的宏实现中，需要调整字段分类的逻辑：

// 修改前
#[salsa::tracked]
struct Function {
    #[id]
    name: String,
    body: String,
}

// 修改后
#[salsa::tracked]
struct Function {
    name: String,  // 默认不跟踪
    #[salsa::tracked]
    body: String,  // 显式标记为跟踪
}

运行时优化

对于非跟踪字段的访问，不再需要完整的跟踪机制：

轻量级访问：非跟踪字段直接读取值，不记录依赖关系。
跟踪字段：保持原有的完整跟踪机制，记录访问并建立依赖关系。

内部API调整

将原来的"id字段"概念重命名为"untracked字段"更符合其语义。
为两种字段类型提供不同的访问方法：
- untracked_fields：用于非跟踪字段的直接访问
- tracked_fields：用于跟踪字段的标准访问

性能影响

这一变更预计会带来以下性能改进：

减少内存开销：非跟踪字段不再需要维护额外的跟踪状态。
降低运行时开销：避免了非跟踪字段访问时的依赖记录操作。
更合理的默认行为：符合大多数使用场景的预期，减少不必要的配置。

向后兼容性

这一变更属于重大设计变更，可能需要：

版本号的主版本号升级。
提供迁移指南，帮助用户调整现有代码。
考虑过渡期的兼容性支持。

总结

Salsa的这一设计变更使得跟踪结构体的行为更加合理和高效。通过反转默认行为并优化字段访问机制，不仅简化了API的使用，还提升了运行时性能。这一改进体现了Salsa框架在实用性和性能之间的平衡考量，是框架成熟度提升的重要标志。

A generic framework for on-demand, incrementalized computation. Inspired by adapton, glimmer, and rustc's query system.

项目地址：https://gitcode.com/gh_mirrors/sa/salsa

登录后查看全文

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

deepin linux kernel

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用