FastExcel 处理 Excel 合并单元格数据读取的技术方案

2025-06-14 05:53:08作者：秋泉律Samson

背景介绍

在日常使用 Excel 进行数据管理时，合并单元格是一种常见的格式化操作。然而，当我们需要通过程序读取这些数据时，合并单元格往往会带来数据读取不完整的问题。FastExcel 作为一款高效的 Java Excel 处理库，提供了完善的解决方案来处理这类场景。

问题现象

当读取包含纵向合并单元格的 Excel 文件时，我们可能会遇到以下情况：

只有合并区域的第一行能获取到实际值
后续行的对应单元格值为 null
需要将这些 null 值自动填充为合并单元格的主值

例如，一个包含题目名称和学科信息的 Excel 表格，题目名称"asd"和学科"数学"被纵向合并了两行，但程序读取时第二行的这些字段会变为 null。

FastExcel 的解决方案

FastExcel 通过 ExtraListener 机制提供了合并单元格的元数据信息，开发者可以利用这些信息实现数据补全。核心步骤如下：

1. 获取合并单元格信息

在读取过程中，FastExcel 会通过 ExtraListener 回调提供合并单元格的详细信息，包括：

合并区域的起始行和结束行
合并区域的起始列和结束列
当前单元格所在位置

这些信息以 JSON 格式提供，包含了判断和处理合并单元格所需的所有数据。

2. 数据处理策略

基于获取的合并单元格信息，我们可以采用以下策略处理数据：

建立合并单元格映射表：在读取过程中记录所有合并区域的信息
数据填充：对于每个 null 值单元格，检查它是否位于某个合并区域内
值复制：如果是合并区域的一部分，则从该区域的主单元格复制值

3. 实现示例

以下是处理合并单元格数据的典型代码结构：

// 定义合并单元格信息存储结构
Map<Integer, Map<Integer, CellRange>> mergeMap = new HashMap<>();

// 在ExtraListener中处理合并信息
@Override
public void extra(CellExtra extra) {
    if (extra.getType() == CellExtraType.MERGE) {
        // 记录合并区域信息
        CellRange range = new CellRange(
            extra.getFirstRowIndex(),
            extra.getLastRowIndex(),
            extra.getFirstColumnIndex(),
            extra.getLastColumnIndex()
        );
        mergeMap.computeIfAbsent(extra.getRowIndex(), k -> new HashMap<>())
               .put(extra.getColumnIndex(), range);
    }
}

// 数据处理时检查合并情况
private Object getCellValue(int rowIndex, int columnIndex, Object rawValue) {
    if (rawValue != null) return rawValue;
    
    if (mergeMap.containsKey(rowIndex) {
        CellRange range = mergeMap.get(rowIndex).get(columnIndex);
        if (range != null) {
            // 从合并区域的主单元格获取值
            return getOriginalValue(range.getFirstRow(), columnIndex);
        }
    }
    return null;
}