Phoenix项目中Span显示问题的分析与解决

2025-06-07 21:20:29作者：郁楠烈Hubert

问题背景

在Phoenix项目中，开发人员遇到了一个关于Span显示的异常问题。当Span同时包含SpanAttributes.OPENINFERENCE_SPAN_KIND设置为RETRIEVER类型和SpanAttributes.RETRIEVAL_DOCUMENTS属性时，Span的显示会中断，无法正确展示追踪信息。

问题现象

开发人员通过代码调试确认，Span的属性设置逻辑本身没有报错，所有属性都能正确设置。调试过程中可以看到完整的属性集合，包括：

session.id
input.value
input.mime_type
retrieval.documents
output.value
output.mime_type

然而，这些属性在Phoenix的UI界面上却无法正常显示，导致追踪信息丢失。

根本原因分析

经过深入排查，发现问题并非单独由RETRIEVAL_DOCUMENTS属性引起，而是该属性与OPENINFERENCE_SPAN_KIND设置为RETRIEVER类型的组合导致了显示异常。

进一步研究发现，Phoenix对Span属性的处理要求属性必须是扁平化的对象结构。当使用简单的JSON字符串设置RETRIEVAL_DOCUMENTS属性时，系统无法正确解析和显示这些数据。

解决方案

正确的做法是将检索文档的属性以扁平化的方式设置到Span中，具体实现如下：

# 查询Weaviate集合并添加追踪
def query_weaviate(query_text, limit=3):
    # 为查询创建一个Span
    with tracer.start_as_current_span(
        "query_weaviate", openinference_span_kind="retriever"
    ) as span:
        # 设置Span的输入
        span.set_input(query_text)

        # 查询集合
        collection_name = "Question"
        chunks = client.collections.get(collection_name)
        results = chunks.query.near_text(query=query_text, limit=limit)

        # 将检索到的文档设置为Span的属性
        for i, document in enumerate(results.objects):
            span.set_attribute(f"retrieval.documents.{i}.document.id", str(document.uuid))
            span.set_attribute(f"retrieval.documents.{i}.document.metadata", str(document.metadata))
            span.set_attribute(
                f"retrieval.documents.{i}.document.content", str(document.properties)
            )

        return results