Erigon项目中的并发映射写入问题分析与解决方案

2025-06-25 02:37:56作者：戚魁泉Nursing

问题背景

在Erigon项目的erigon-lib组件中，commitment包负责处理状态树的提交和验证工作。近期在测试过程中发现了一个严重的并发安全问题，涉及到MockState结构体中的映射(map)数据结构在多线程环境下的读写冲突。

错误现象

测试过程中出现了两种典型的错误表现：

并发映射写入导致的致命错误：系统抛出"fatal error: concurrent map writes"异常，直接导致程序崩溃。堆栈跟踪显示问题发生在MockState的PutBranch方法中，具体位置是patricia_state_mock_test.go文件的第58行。
数据竞争警告：Go语言的竞争检测器报告了明确的读写冲突。一个goroutine正在执行mapassign操作(写入)，而另一个goroutine同时在进行mapaccess1操作(读取)，两者操作的是同一个映射地址0x00c00040a660。

技术分析

根本原因

问题的核心在于MockState结构体内部使用了一个非线程安全的映射(map)来存储分支数据，而系统在以下两个场景中同时访问了这个映射：

写入操作：通过PutBranch方法更新分支数据
读取操作：通过Branch方法查询分支数据

在并发执行的测试场景中，HexPatriciaHashed结构体的fold和unfold操作会并行调用这些方法，导致了经典的读写竞争条件。

影响范围

这个问题直接影响到了commitment包的以下功能组件：

HexPatriciaHashed：负责Patricia树的核心逻辑
ConcurrentPatriciaHashed：专门设计用于并发处理的Patricia树变体
Updates.ParallelHashSort：并行哈希排序功能

解决方案

短期修复

最直接的解决方案是为MockState中的映射访问添加互斥锁保护：

type MockState struct {
    mu      sync.RWMutex
    branches map[string]BranchData
}

func (ms *MockState) PutBranch(key []byte, data BranchData) {
    ms.mu.Lock()
    defer ms.mu.Unlock()
    ms.branches[string(key)] = data
}

func (ms *MockState) Branch(key []byte) (BranchData, bool) {
    ms.mu.RLock()
    defer ms.mu.RUnlock()
    data, ok := ms.branches[string(key)]
    return data, ok
}