RectorPHP中处理Doctrine ORM注解转换时的空格问题分析

2025-05-25 13:31:40作者：昌雅子Ethen

问题背景

在RectorPHP项目中，当使用AnnotationToAttributeRector和NestedAnnotationToAttributeRector规则将Doctrine ORM注解转换为PHP 8属性时，发现了一个与代码格式相关的问题。具体表现为当@ORM\Table注解中的indexes数组前存在空行时，转换会出现异常。

问题复现

考虑以下Doctrine实体类的注解写法：

/**
 * @ORM\Entity(repositoryClass="App\Repository\SegmentRepository")
 * @ORM\Table(
 *     name="segments",
 *
 *     indexes={
 *     @ORM\Index(name="sequence", columns={"sequence"}),
 *     @ORM\Index(name="status_channel_started_at", columns={"status", "channel", "started_at"})
 * }
 * )
 */
class Segment
{
}

在这个例子中，indexes数组前有一个空行。当使用Rector进行转换时，这种格式会导致转换结果不符合预期。

预期行为

根据Doctrine ORM 2.13的文档，正确的转换结果应该是：

#[ORM\Index(name: "sequence", columns: ["sequence"])]
#[ORM\Index(name: "status_channel_started_at", columns: ["status", "channel", "started_at"])]

问题分析

这个问题本质上是由代码格式化引起的解析问题。Rector在解析PHPDoc注释时，对于包含空行的复杂注解结构处理不够健壮。具体表现在：

空行被视为注解结构的一部分，影响了注解解析器的正常工作
嵌套注解的解析逻辑没有充分考虑各种代码格式化情况
转换过程中丢失了部分嵌套注解信息

解决方案

目前有两种解决思路：

临时解决方案：手动移除indexes前的空行，保持注解的紧凑格式。这是最简单直接的解决方法。
长期解决方案：需要改进Rector的注解解析器，使其能够正确处理包含空格的复杂注解结构。这可能需要：
- 增强phpdoc-parser对空白字符的处理能力
- 在NestedAnnotationToAttributeRector中添加对格式变化的容错处理
- 完善测试用例，覆盖各种格式化场景