Crystal语言中宏表达式内空白字符保留问题解析

2025-05-11 14:33:40作者：宣海椒Queenly

背景介绍

在Crystal语言的宏系统中，开发人员发现了一个关于代码位置信息保留的问题。当宏表达式被包含在MacroVerbatim节点中时，原始代码中的空白字符（如换行符和注释）会被忽略，导致最终生成的代码位置信息不准确。

问题现象

在普通宏表达式中，Crystal能够正确保留代码的位置信息。例如以下代码：

{%
  10

  # Foo

  20
  30

  # Bar

  40
%}
{%
  50
  60
%}

解析器能够正确记录每个数字的行号信息。但当同样的代码被包含在MacroVerbatim块中时：

macro finished
  {% verbatim do %}
    {%
      10

      # Foo

      20
      30

      # Bar

      40
    %}
    {%
      50
      60
    %}
  {% end %}
end

解析后的位置信息就不再准确，因为宏表达式被转换为字符串表示时丢失了原始代码中的空白字符和注释。

技术分析

这个问题源于Crystal宏系统的工作机制。当处理MacroVerbatim节点时：

宏表达式首先被解析为抽象语法树(AST)
然后这个AST被转换回字符串表示
最后这个字符串会被重新解析

在这个过程中，原始代码中的空白字符和注释信息在第一步到第二步的转换中丢失了。虽然#15305补丁部分解决了这个问题，保留了{%后的换行符，但整体位置信息仍然不完全准确。

解决方案探讨

目前提出了两种可能的解决方案：

增加MacroLiteral节点：修改解析器，使其在解析宏表达式时创建特殊的MacroLiteral节点来表示注释和额外的换行符。这样可以确保在将AST转换回字符串时保留这些空白字符。
直接保留原始源代码：让verbatim块直接保留原始源代码字符串，而不是先解析为AST再转换回字符串。这种方法更直接，但可能无法覆盖所有使用场景。