Erigon项目中关于Torrent存储实现的优化方案

2025-06-25 11:12:03作者：苗圣禹Peter

背景介绍

在分布式系统开发中，高效可靠的数据存储机制是系统稳定运行的基础。Erigon作为一个区块链客户端实现，其底层依赖了torrent技术进行数据分发和存储。近期开发团队针对torrent存储实现进行了一系列优化，旨在解决现有架构中的一些关键问题。

原有架构的问题

在原有实现中，torrent存储主要存在三个方面的技术挑战：

内存管理问题：采用内存映射文件(MMAP)方式导致内存占用过高，在某些场景下会出现内存溢出
同步机制缺陷：数据同步逻辑不够健壮，容易出现页面错误和调度异常
持久化设计不合理：数据完整性验证状态(piece completion)与数据文件分离存储，增加了系统复杂度

优化方案设计

开发团队提出了一个三管齐下的优化方案：

1. 回归文件API基础

放弃原有的内存映射方式，回归到传统的文件I/O操作。测试表明这一改变不仅解决了内存问题，还带来了以下优势：

消除了页面错误风险
改善了调度器行为
性能指标没有明显下降

2. 引入.part文件机制

对于未完成下载的数据块，采用.part扩展名标识。这一设计带来了多重好处：

明确了数据状态，便于外部工具识别
简化了同步逻辑
移除了不必要的flush API调用
提高了系统与其他组件的兼容性

3. 优化持久化存储布局

对数据完整性状态的存储位置进行了重新设计，提供两种可选方案：

与数据文件同目录存储：降低配置错误风险
完全移除独立存储：简化架构

技术实现细节

在具体实现过程中，开发团队特别关注了以下技术点：

文件句柄管理：优化了文件打开/关闭策略，避免资源泄漏
并发控制：改进了锁机制，提高多线程环境下的性能
错误恢复：增强了异常处理能力，确保系统稳定性
兼容性设计：确保新实现能够平滑处理旧格式数据

性能评估

经过严格测试，新实现展现出以下特点：

内存占用显著降低
系统稳定性大幅提升
I/O吞吐量保持原有水平
极端条件下的容错能力增强

总结

Erigon项目对torrent存储层的这次重构，体现了从实际问题出发的工程思维。通过回归基础、简化设计、明确状态标识等技术手段，有效解决了原有架构中的痛点问题。这种优化思路对于其他分布式存储系统的设计也具有参考价值，特别是在处理大规模数据分发场景时，平衡性能与可靠性是关键考量。

erigon

Ethereum implementation on the efficiency frontier

项目地址：https://gitcode.com/GitHub_Trending/er/erigon

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理