PhpSpreadsheet读取合并单元格问题解析

2025-05-16 04:41:11作者：龚格成

在使用PHPOffice的PhpSpreadsheet库处理Excel文件时，开发者可能会遇到一个常见问题：当尝试读取包含合并单元格的Excel文件时，getMergeCells()方法返回空数组，无法正确识别合并单元格区域。本文将深入分析该问题的成因及解决方案。

问题现象

开发者反馈在使用PhpSpreadsheet 3.3.0和PHP 8.2环境下，读取包含合并单元格的Excel文件时，调用getMergeCells()方法无法获取预期的合并单元格信息。测试文件为XLSX格式，确认在Excel客户端中确实存在合并单元格，但通过代码读取时却无法识别。

根本原因分析

经过技术验证，发现问题主要与PhpSpreadsheet的读取模式有关。当使用setReadDataOnly(true)方法设置只读数据模式时，PhpSpreadsheet会忽略文件中的格式信息，包括合并单元格、样式等非数据内容。这是设计上的预期行为，而非程序缺陷。

解决方案

要正确读取合并单元格信息，开发者需要避免使用只读数据模式，或者明确需要同时读取格式信息。以下是两种处理方式：

完全读取模式（推荐）

$reader = IOFactory::createReaderForFile($filePath);
// 不设置setReadDataOnly或显式设为false
$reader->setReadDataOnly(false); 
$spreadsheet = $reader->load($filePath);

分步处理模式

// 第一步：仅读取数据
$readerData = IOFactory::createReaderForFile($filePath);
$readerData->setReadDataOnly(true);
$data = $readerData->load($filePath);

// 第二步：读取格式信息
$readerFormat = IOFactory::createReaderForFile($filePath);
$readerFormat->setReadDataOnly(false);
$format = $readerFormat->load($filePath);
$mergedCells = $format->getSheet(0)->getMergeCells();