OpenLLMetry项目中WatsonX自动插桩的流式响应处理问题分析

2025-06-06 15:15:05作者：殷蕙予

问题背景

在OpenLLMetry项目的WatsonX自动插桩模块中，开发人员发现了一个关于流式响应处理的潜在问题。该问题主要出现在处理WatsonX模型的流式响应时，当响应内容为空或异常情况下，代码会抛出UnboundLocalError异常。

问题现象

具体错误表现为：

UnboundLocalError: cannot access local variable 'stream_model_id' where it is not associated with a value

这个错误发生在_build_and_set_stream_response函数中，当尝试访问stream_model_id变量时，该变量可能尚未被正确初始化。

技术分析

原始代码逻辑

原始实现中，stream_model_id变量是在处理流式响应的循环内部被赋值的：

for item in response:
    stream_model_id = item["model_id"]
    # 其他处理逻辑...

然而，在循环外部，代码直接引用了这个变量来构建共享属性：

shared_attributes = _metric_shared_attributes(
    response_model=stream_model_id, is_streaming=True
)

问题根源

这种实现存在两个潜在风险：

当response为空或迭代过程中出现异常时，stream_model_id变量将不会被赋值，导致后续引用时抛出UnboundLocalError。
即使response不为空，如果其中的某些项不包含model_id字段，同样会导致变量未被正确初始化。

解决方案

防御性编程改进

正确的做法应该采用防御性编程策略：

变量预初始化：在函数开始时为所有可能用到的变量设置默认值。
空响应处理：增加对空响应或异常情况的处理逻辑。
字段存在性检查：在访问字典字段前进行存在性验证。

改进后的实现

def _build_and_set_stream_response(
    span,
    response,
    raw_flag,
    token_histogram,
    response_counter,
    duration_histogram,
    start_time,
):
    # 预初始化所有变量
    stream_generated_text = ""
    stream_generated_token_count = 0
    stream_input_token_count = 0
    stream_model_id = None
    stream_stop_reason = None

    try:
        for item in response:
            # 安全访问字典字段
            model_id = item.get("model_id")
            if model_id is not None:
                stream_model_id = model_id
            
            # 其他字段处理...
            
            if raw_flag:
                yield item
            else:
                yield item["results"][0]["generated_text"]
    except Exception as e:
        # 异常处理逻辑
        span.record_exception(e)
        span.set_status(Status(StatusCode.ERROR))
        span.end()
        return

    # 仅在变量被赋值后使用
    if stream_model_id is not None:
        shared_attributes = _metric_shared_attributes(
            response_model=stream_model_id, is_streaming=True
        )
        # 后续处理逻辑...