dbt-core项目中的run_results.json缺失问题分析

2025-05-22 18:34:32作者：廉彬冶Miranda

问题背景

在dbt-core项目中，run_results.json是一个关键的执行结果文件，它记录了dbt运行过程中各个模型的状态、执行时间等重要信息。然而，近期有用户报告在特定情况下该文件会缺失，特别是在使用dbt Cloud的versionless功能时，当作业运行失败后，系统无法生成run_results.json文件。

问题现象

用户在使用dbt-core 2024.10.258版本时发现，当作业运行失败时（特别是由于数据库错误导致失败），虽然manifest和日志文件都能正常生成，但run_results.json文件却缺失了。这种情况在使用dbt Cloud CLI时还会引发额外的兼容性错误提示。

问题复现与根因分析

经过技术团队深入分析，发现问题主要出现在dbt执行on-run-end钩子时发生异常的场景下。当钩子执行过程中抛出异常，会导致dbt无法正常完成整个执行流程，从而跳过了run_results.json文件的生成步骤。

通过以下步骤可以稳定复现该问题：

创建一个会抛出异常的宏（如强制抛出编译器错误）
在dbt_project.yml中配置该宏作为on-run-end钩子
运行一个简单的模型
检查target目录下的run_results.json文件

在这种情况下，虽然模型本身执行成功，但由于on-run-end钩子执行失败，最终导致run_results.json文件缺失。

技术影响

run_results.json文件的缺失会带来多方面的影响：

监控系统失效：许多基于dbt的监控系统依赖该文件来判断作业执行状态和性能指标
CI/CD流程中断：自动化流程可能因为无法获取执行结果而中断
调试困难：缺少了关键的执行结果记录，增加了问题排查的难度

解决方案与建议

针对这一问题，建议采取以下措施：

版本回退：暂时回退到dbt-core 1.7版本可以规避此问题
钩子异常处理：在自定义钩子中添加完善的异常处理逻辑，避免因钩子失败导致整个流程中断
等待官方修复：关注dbt-core项目的更新，及时升级到修复此问题的版本

最佳实践

为避免类似问题影响生产环境，建议：

在关键业务流程中避免使用可能抛出异常的钩子
对自定义钩子进行充分的测试，特别是异常场景的测试
实现备份机制，在run_results.json缺失时能够从日志等其他来源恢复关键信息

总结

dbt-core中run_results.json文件的缺失问题揭示了在异常处理流程中的一个潜在缺陷。虽然短期内可以通过版本回退等方式规避，但长期来看，需要等待官方修复并加强自身的异常处理能力。这个问题也提醒我们在使用dbt这类数据工具时，需要充分理解其内部机制，特别是在错误处理和结果收集方面的行为。

dbt-core

dbt enables data analysts and engineers to transform their data using the same practices that software engineers use to build applications.

项目地址：https://gitcode.com/GitHub_Trending/db/dbt-core

登录后查看全文