OpenLLMetry项目中的自定义图片上传器功能解析

2025-06-06 16:52:29作者：钟日瑜

在OpenLLMetry项目中，开发者damianr13提出了一个关于Anthropic Instrumentation组件的功能增强需求，希望能够允许用户实现自定义的图片上传器。这一功能对于使用Anthropic API进行视觉任务处理的开发者来说具有重要意义。

需求背景

在实际应用中，许多开发者已经建立了自己的图片上传和存储系统。当这些开发者使用OpenLLMetry进行API调用追踪时，系统默认会将图片上传到Traceloop的存储服务。这就导致了两个问题：

数据冗余：图片需要在开发者自己的存储系统和Traceloop系统中各存一份
映射管理：开发者需要维护自己存储的URL和Traceloop存储URL之间的映射关系

特别是在后续进行模型微调时，开发者更希望所有数据都集中在自己平台上，而不是分散在多个系统中。

技术实现方案

目前，开发者可以通过以下方式实现自定义图片上传器：

Traceloop.init()
anthropic_instrumentor = AnthropicInstrumentor(
    upload_base64_image=AnthropicTraceloopImageHandler().aupload_base64_image
)
if anthropic_instrumentor.is_instrumented_by_opentelemetry:
    anthropic_instrumentor.uninstrument()
anthropic_instrumentor.instrument()

但这种实现方式存在以下不足：

需要手动解除和重新应用instrumentation
代码不够直观和简洁

理想的实现方式应该是：

Traceloop.init(image_uploader=AnthropicTraceloopImageHandler())

自定义图片上传器实现示例

开发者提供了一个自定义图片上传器的实现示例：

from traceloop.sdk.images.image_uploader import ImageUploader
from api.pricing.decorators import singleton
from logging import getLogger

logger = getLogger(__name__)

@singleton
class AnthropicTraceloopImageHandler(ImageUploader):
    def __init__(self):
        super().__init__(None, None)
        self.url_cache = {}

    def register_image_url(self, trace_id: int, image_b64: str, url: str):
        if trace_id not in self.url_cache:
            self.url_cache[trace_id] = {}
        self.url_cache[trace_id][image_b64] = url

    def release_images(self, trace_id: int):
        self.url_cache.pop(trace_id, None)

    async def aupload_base64_image(self, trace_id, span_id, image_name, image_file):
        try:
            return self.url_cache.get(trace_id).get(image_file)
        except KeyError as e:
            logger.warning(f"Could not find image for the trace {trace_id}", exc_info=e)
            return "https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcTNNLEL-qmmLeFR1nxJuepFOgPYfnwHR56vcw&s"