SQLFluff 文件扩展名匹配问题分析与解决方案

2025-05-26 11:59:40作者：昌雅子Ethen

SQLFluff 作为一款优秀的 SQL 代码格式化工具，在 3.1.1 版本后出现了一个影响文件发现功能的重要问题：无法正确处理带有复合扩展名（如 .sql.j2）的文件。本文将深入分析该问题的成因、影响范围以及解决方案。

问题背景

在软件开发中，复合扩展名非常常见，特别是在使用模板引擎的场景下。例如：

SQLFluff 从 3.1.1 版本开始，文件发现机制发生了变化，导致这类复合扩展名的文件无法被正确识别和处理。

当用户执行以下命令时：

sqlfluff lint --dialect=ansi .

工具能够正常发现并处理简单的 .sql 文件，但对于复合扩展名的文件（如 query.sql.j2）则会被完全忽略，不会进行任何检查或格式化操作。

通过代码审查和测试，我们发现问题的根源在于文件扩展名匹配逻辑的变化。在 3.1.1 版本之前，SQLFluff 使用的是更宽松的文件匹配策略，能够识别复合扩展名中的 SQL 文件特征。而新版本中，匹配逻辑变得更加严格，只匹配确切的 .sql 扩展名。

这种变化可能源于对性能优化的考虑，但意外地影响了模板文件的处理能力。对于依赖模板引擎（如 Jinja2、Liquid）生成 SQL 的项目，这会导致重要的代码质量检查被跳过。

针对这个问题，我们建议从以下几个层面解决：

临时解决方案：可以通过明确指定文件路径来绕过自动发现机制
```
sqlfluff lint --dialect=ansi query.sql.j2
```
配置解决方案：在 .sqlfluff 配置文件中显式指定需要处理的文件模式
```
[sqlfluff]
include_paths = *.sql,*.sql.j2,*.sql.liquid
```
代码修复方案：从根本上修复文件发现逻辑，使其能够正确处理复合扩展名。这需要修改核心的文件发现模块，确保：
- 能够识别以 .sql 结尾的任何扩展名
- 保持与旧版本的兼容性
- 不显著影响性能