OpenLLMetry项目中异步生成器装饰器的正确实现方式

2025-06-06 06:44:46作者：范靓好Udolf

Open-source observability for your GenAI or LLM application, based on OpenTelemetry

项目地址：https://gitcode.com/gh_mirrors/op/openllmetry

在Python异步编程中，异步生成器(AsyncGenerator)是一种强大的工具，它允许我们在异步函数中使用yield语句来生成一系列值。然而，在OpenLLMetry这样的分布式追踪系统中，如何正确地为异步生成器添加装饰器却是一个需要特别注意的技术点。

异步生成器的基本特性

异步生成器与普通生成器的主要区别在于它们的执行方式。普通生成器使用yield语句产生值，而异步生成器则在async def函数中使用yield，并且需要通过async for循环来消费这些值。这种特性使得异步生成器非常适合处理I/O密集型任务，如网络请求或数据库查询。

常见错误实现方式

在OpenLLMetry项目的早期版本中，对异步生成器的装饰器实现存在一个典型错误：尝试直接await一个异步生成器对象。这种操作在Python中是不合法的，会导致TypeError异常，因为异步生成器本身不是可等待对象。

错误实现通常表现为：

if isinstance(res, types.AsyncGeneratorType):
    return await _ahandle_generator(span, ctx_token, res)

正确的实现方案

要正确处理异步生成器，我们需要创建一个包装函数，该函数能够：

保持异步生成器的特性
正确管理追踪span的生命周期
确保上下文在生成器结束时被正确清理

以下是改进后的实现方式：

if isinstance(res, types.AsyncGeneratorType):
    async def wrapped_generator():
        try:
            async for item in res:
                yield item
        finally:
            span.end()
            context_api.detach(ctx_token)
    return wrapped_generator()

实现原理详解

包装函数设计：我们创建一个新的异步生成器函数wrapped_generator，它将代理原始生成器的所有yield操作。
异常处理：使用try-finally结构确保无论生成器是正常结束还是抛出异常，span和上下文都能被正确清理。
生命周期管理：在finally块中结束span并分离上下文，这是分布式追踪系统中的关键操作，确保追踪数据的完整性。
代理迭代：通过async for循环代理原始生成器的迭代过程，保持原有的异步特性。

实际应用场景

这种实现方式特别适用于以下场景：

FastAPI等异步Web框架的流式响应端点
需要逐步返回大量数据的异步ETL流程
实时数据处理管道
任何需要长时间运行并分批次返回结果的异步操作

性能考量

虽然包装器会引入轻微的性能开销，但这种开销通常可以忽略不计，因为：

包装逻辑只在生成器开始和结束时执行
主要的I/O等待时间远大于包装逻辑的执行时间
追踪系统本身的开销通常大于包装器的开销

最佳实践建议

在装饰异步生成器时，始终检查返回值类型
确保span的生命周期与生成器的生命周期一致
考虑添加额外的错误处理逻辑，以便在生成器出错时记录适当的追踪信息
对于性能敏感的应用，可以对包装器进行基准测试

通过这种实现方式，我们既保持了异步生成器的所有特性，又能够无缝集成到OpenLLMetry的分布式追踪系统中，为复杂的异步数据流提供了完整的可观测性支持。

Open-source observability for your GenAI or LLM application, based on OpenTelemetry

项目地址：https://gitcode.com/gh_mirrors/op/openllmetry

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。