Hamilton项目中的异步DataDog监控优化实践

2025-07-04 22:00:58作者：吴年前Myrtle

Your single tool to express data, ML, and LLM pipelines with simple python functions. Runs anywhere that python runs, E.G. spark, airflow, jupyter, fastapi, etc. Incrementally adoptable. Use Hamilton to build testable, reusable, and self-documenting dataflows with lineage and metadata out of the box.

项目地址：https://gitcode.com/gh_mirrors/ha/hamilton

背景介绍

在现代Python异步编程环境中，特别是在FastAPI等异步框架中使用Hamilton时，现有的DataDog监控工具(DDOGMonitor)存在一些局限性。主要问题表现在两个方面：一是监控工具只能记录协程创建时的记录点，无法准确记录函数实际执行的时间；二是在FastAPI应用中，Hamilton的监控与FastAPI请求监控无法形成关联关系，导致监控数据分散。

问题分析

传统的DDOGMonitor实现基于同步接口，当应用于AsyncDriver时，它会在每个Hamilton函数/节点创建协程时生成记录点，但无法追踪函数体实际执行的时间点。这导致性能指标不够准确，无法反映真实的执行耗时。

另一个关键问题是上下文传播的缺失。在FastAPI应用中，FastAPI中间件生成的请求监控与Hamilton的执行监控应该是关联关系，但当前实现导致它们成为两个独立的监控记录，破坏了端到端可观测性。

解决方案

针对这些问题，我们实现了异步版本的DataDog监控工具，主要改进点包括：

创建了专门的异步版本监控类，继承自适当的异步钩子接口
确保记录点能够准确记录函数体实际执行的起止时间
实现了与FastAPI请求监控的上下文关联，形成完整的调用链

技术实现上，我们参考了OpenTelemetry适配器的异步处理方式，但最终选择了专注于DataDog的实现，因为在测试中发现OTel适配器可能会引入额外开销或阻塞事件循环。

实现细节

异步版本的DataDog监控工具核心改进在于：

正确处理异步上下文，确保记录点在协程实际执行时被激活
维护适当的异步友好状态
与FastAPI的请求监控上下文正确集成

实现过程中，我们保持了与原有接口的兼容性，同时通过异步钩子提供了更精确的监控能力。这使得开发者可以无缝升级，获得更准确的性能指标和更好的监控可视化。

实际效果

优化后的异步DataDog监控工具能够：

准确记录每个Hamilton节点的实际执行时间
在FastAPI应用中形成完整的请求调用链
提供更精确的性能分析和问题诊断能力
保持与现有DataDog监控体系的兼容性

这对于在异步环境中使用Hamilton的团队来说，显著提升了系统的可观测性和性能分析能力。

总结

通过对Hamilton的DataDog监控工具进行异步优化，我们解决了在AsyncDriver和FastAPI环境中的监控准确性和上下文关联问题。这一改进使得Hamilton在异步环境中的可观测性达到了与同步环境相当的水平，为开发者提供了更可靠的性能监控手段。

Your single tool to express data, ML, and LLM pipelines with simple python functions. Runs anywhere that python runs, E.G. spark, airflow, jupyter, fastapi, etc. Incrementally adoptable. Use Hamilton to build testable, reusable, and self-documenting dataflows with lineage and metadata out of the box.

项目地址：https://gitcode.com/gh_mirrors/ha/hamilton

登录后查看全文

最新内容推荐

Python开发者的macOS终极指南：VSCode安装配置全攻略基于Matlab的等几何分析IGA软件包：工程计算与几何建模的完美融合深入解析Windows内核模式驱动管理器：系统驱动管理的终极利器基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器咖啡豆识别数据集：AI目标检测在咖啡质量控制中的革命性应用 STM32到GD32项目移植完全指南：从兼容性到实战技巧瀚高迁移工具migration-4.1.4：企业级数据库迁移的智能解决方案昆仑通态MCGS与台达VFD-M变频器通讯程序详解：工业自动化控制完美解决方案 PADS元器件位号居中脚本：提升PCB设计效率的自动化利器 MQTT客户端软件源代码：物联网开发的强大工具与最佳实践指南

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

cangjie_runtime

仓颉编程语言运行时与标准库。