Lighthouse项目中删除LevelDB/Redb的transaction_mutex分析

2025-06-26 01:18:17作者：曹令琨Iris

在Lighthouse区块链客户端的开发过程中，数据库层的并发控制一直是一个关键的设计考量。本文将深入分析在tree-states功能实现后，为何可以安全地移除数据库中的transaction_mutex锁机制。

背景

在早期的Lighthouse实现中，为了确保数据库状态的一致性，开发团队在热数据库(hot DB)和冷数据库(freezer DB)中引入了一个名为transaction_mutex的人工锁机制。这个锁的主要目的是防止多个线程同时写入或删除同一个状态时导致的数据不一致问题。

原始设计考量

最初引入transaction_mutex是为了解决以下场景可能引发的问题：

多个线程同时写入相同的状态
一个线程正在写入状态的同时，另一个线程正在删除该状态

在没有锁保护的情况下，这些并发操作可能导致数据库进入不一致的状态，影响后续的区块导入和状态验证。

技术演进

随着tree-states功能的实现和修剪(pruning)算法的改进，数据库层的设计发生了重要变化：

新的修剪算法基于热状态摘要(hot state summaries)的遍历来删除任何游离状态
状态管理变得更加健壮，能够处理一些边界情况

锁机制分析

在新的架构下，我们重新评估了transaction_mutex的必要性：

重复写入场景：多个线程写入相同状态时，由于状态内容相同，最多只会造成少量重复I/O操作，不会影响数据一致性
写入被删除状态场景：如果写入一个已被修剪删除的状态，该状态将在下次修剪运行时再次被删除

深入问题分析

进一步分析发现，即使在保留transaction_mutex的情况下，仍然存在无法完全防止的边界情况：

区块验证过程中标记为已存在的状态(skipped state)可能被并发运行的修剪线程删除
区块通过最终性(finalization)检查后，其祖先状态可能被迁移和修剪过程删除
最终区块及其状态被提交，但部分祖先状态缺失

结论与改进

基于以上分析，我们得出以下结论：

transaction_mutex无法完全防止它设计要防范的那类问题
与其依赖锁机制，不如使修剪算法更加健壮，能够优雅处理状态不连续的情况
删除transaction_mutex后，系统设计更加简洁，同时不会降低可靠性

实现方案

最终的解决方案是：

完全移除transaction_mutex锁机制
增强修剪算法，使其能够处理状态图中的不连续情况
确保系统能够正确处理部分祖先状态缺失的场景

这一改进使得Lighthouse的数据库层更加高效，同时保持了系统的强一致性保证，为后续性能优化和功能扩展奠定了更好的基础。

lighthouse

Ethereum consensus client in Rust

项目地址：https://gitcode.com/gh_mirrors/ligh/lighthouse

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

1.13 K

271