pre-commit-hooks项目中JSON格式化工具的行为分析与改进建议

2025-06-06 10:24:39作者：范靓好Udolf

在代码质量管控体系中，pre-commit框架作为Git钩子管理工具被广泛使用，其配套的pre-commit-hooks项目提供了多种开箱即用的代码检查工具。其中pretty-format-json作为JSON文件格式化工具，在实际使用中存在一个值得开发者注意的行为特性。

问题现象

当pretty-format-json处理JSON文件序列时，如果遇到不符合标准JSON格式的文件（例如包含JSON5风格的注释），工具会立即终止处理流程并输出错误信息。这种中断式处理方式在实际协作环境中可能引发以下问题：

批量处理中断：当pre-commit将文件分成多个处理批次时，中间批次出现格式错误会导致后续批次完全跳过
错误感知偏差：开发者可能误认为只有报错的文件存在问题，而实际上后续未处理的文件可能同样需要修正
修复效率降低：需要反复运行工具才能发现所有格式问题

技术背景分析

标准JSON规范(RFC 8259)与JSON5等扩展规范的主要差异包括：

注释语法（//或/* */）
尾随逗号允许
单引号字符串支持
数字格式扩展

pretty-format-json基于Python的json模块实现，该模块严格遵循标准JSON规范，因此会拒绝任何包含非标准特性的文件。

改进方案建议

理想的处理方式应该具备以下特征：

全量检查：遍历所有指定文件，收集全部格式问题
分级报告：区分致命错误（完全无效的JSON）和格式警告（可自动修复的问题）
渐进式修复：对符合标准的文件执行格式化，对非标文件给出明确修复建议

实现方案可考虑：

def format_json_files(filenames):
    errors = []
    formatted = 0
    
    for filename in filenames:
        try:
            with open(filename) as f:
                data = json.load(f)
            with open(filename, 'w') as f:
                json.dump(data, f, indent=2)
            formatted += 1
        except ValueError as e:
            errors.append((filename, str(e)))
    
    if errors:
        for filename, error in errors:
            print(f"Invalid JSON: {filename} - {error}")
        return 1
    return 0