ClosedXML共享公式重计算性能问题分析与解决方案

2025-06-09 02:58:34作者：管翌锬

ClosedXML is a .NET library for reading, manipulating and writing Excel 2007+ (.xlsx, .xlsm) files. It aims to provide an intuitive and user-friendly interface to dealing with the underlying OpenXML API.

项目地址：https://gitcode.com/gh_mirrors/cl/ClosedXML

问题背景

在Excel文件处理库ClosedXML中，从0.101.0版本开始出现了一个显著的性能退化问题。当工作表中包含共享公式时，公式重计算的执行时间会显著增加，在某些情况下甚至会导致计算过程无法完成。这个问题在0.102.2版本中表现得尤为严重，而在0.104.1版本中得到了基本解决。

问题表现

具体表现为：

对于包含共享公式的工作表，0.100.3及以下版本能在约1秒内完成计算
0.101.0至0.102.2版本会出现计算无法完成的情况，并伴随内存激增
0.103.0及以上版本计算时间延长至约12秒

问题复现

要复现这个问题，可以创建一个包含以下特点的Excel文件：

在A列填充查找值（如"Lookup 1"、"Lookup 2"等）
在B列设置共享公式，引用C列的值
在C列使用VLOOKUP函数从A:D区域查找数据
在D列填充索引值

当调用RecalculateAllFormulas()方法时，就能观察到性能差异。

技术分析

经过深入分析，这个问题主要与XLCalcEngine中的TryGetPrecedentAreas功能有关。在问题版本中：

当一个前置区域的结束范围被错误地设置为最大单元格(1048576)时，即使实际数据只有几行，系统也会尝试处理整个范围
这种错误的范围设置导致系统需要检查数百万个不必要的单元格
在共享公式场景下，这个问题会被放大，因为每个共享公式实例都会触发这种低效的查找

解决方案

ClosedXML团队在0.104.1版本中基本解决了这个问题：

优化了前置区域的范围检测逻辑，避免不必要的全表扫描
改进了共享公式的计算机制
虽然性能相比0.100.3仍有约10%的差距，但已经可以满足大多数使用场景

最佳实践建议

对于使用ClosedXML处理Excel文件的开发者：

如果遇到公式计算性能问题，首先检查是否使用了共享公式
考虑升级到0.104.1或更高版本
对于关键性能场景，可以进行性能基准测试，比较不同版本的表现
如果必须使用旧版本，可以考虑将共享公式转换为普通公式作为临时解决方案

总结

ClosedXML的公式计算性能问题展示了软件迭代过程中可能出现的性能退化现象。通过社区反馈和开发者修复，这个问题已经得到显著改善。这也提醒我们在依赖库升级时需要关注性能变化，并及时测试验证。

对于大多数用户来说，升级到最新稳定版本是解决此类问题的最佳方案。同时，在性能敏感场景下，针对特定工作负载进行基准测试也是保证系统稳定性的重要手段。

ClosedXML

项目地址：https://gitcode.com/gh_mirrors/cl/ClosedXML

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.35 K

758