OpenLLMetry项目中OpenAI Assistant API监控功能的Token统计问题分析

2025-06-06 23:22:35作者：薛曦旖Francesca

Open-source observability for your GenAI or LLM application, based on OpenTelemetry

项目地址：https://gitcode.com/gh_mirrors/op/openllmetry

背景介绍

在OpenLLMetry项目的OpenAI监控组件中，开发者发现了一个关于Assistant API调用的监控数据不完整问题。该项目主要用于对各类生成式AI服务进行监控和追踪，但在处理OpenAI Assistant API的响应时，未能正确捕获关键的Token使用量数据。

问题现象

当开发者使用OpenAI Assistant API时，监控系统存在两个明显的功能缺失：

系统属性标识缺失：监控数据中缺少gen_ai.system=openai这一关键标识，这使得后续的数据分析和归类变得困难。
Token统计信息丢失：虽然OpenAI Assistant API的响应中包含了详细的Token使用数据（包括prompt tokens、completion tokens和total tokens），但监控系统未能将这些数据记录到追踪信息中。

技术分析

监控数据收集机制

在标准的OpenAI API调用监控中，系统通常会从API响应中提取以下关键信息：

系统标识：用于区分不同的AI服务提供商
Token用量：反映API调用的资源消耗情况
响应内容：用于调试和分析

问题根源

通过对代码的分析，我们发现问题的根源在于：

系统属性设置遗漏：在创建监控span时，没有显式设置系统标识属性。
Token统计处理逻辑不完整：监控组件没有从run.usage对象中提取Token使用数据，即使这些数据已经包含在API响应中。

解决方案建议

要解决这个问题，需要在监控组件中做以下改进：

添加系统标识：在创建span时，应当明确设置系统属性：
```
span.set_attribute("gen_ai.system", "openai")
```

完善Token统计处理：应当从API响应中提取Token使用数据并记录到监控信息中：

if hasattr(run, 'usage') and run.usage:
    span.set_attribute("gen_ai.usage.prompt_tokens", run.usage.prompt_tokens)
    span.set_attribute("gen_ai.usage.completion_tokens", run.usage.completion_tokens)
    span.set_attribute("gen_ai.usage.total_tokens", run.usage.total_tokens)

影响评估

这个问题的存在会导致：

监控数据不完整：无法准确统计API调用的资源消耗情况。
数据分析困难：缺少系统标识使得跨系统比较和分析变得复杂。
计费估算不准确：Token使用量是OpenAI API计费的重要依据，缺少这些数据会影响成本估算。

最佳实践建议

对于使用OpenLLMetry监控OpenAI服务的开发者，建议：

及时更新到修复后的版本。
在自定义监控逻辑时，确保捕获所有关键的API响应数据。
定期检查监控数据的完整性，特别是Token使用量等关键指标。

总结

OpenLLMetry作为生成式AI服务的监控工具，其数据收集的完整性至关重要。本次发现的OpenAI Assistant API监控问题虽然看似简单，但直接影响到了监控数据的实用性和准确性。通过修复这个问题，可以显著提升监控系统的数据质量，为后续的性能分析和成本优化提供可靠依据。

Open-source observability for your GenAI or LLM application, based on OpenTelemetry

项目地址：https://gitcode.com/gh_mirrors/op/openllmetry

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

阅读APP书源高效配置技巧：二维码导入方案全解析 7个维度解析log-lottery：企业级3D抽奖系统的技术架构与实践指南 4个步骤实现文档数字化转型：构建企业级智能文档管理系统如何用300元打造会思考的无人机？开源方案全解析突破系统壁垒：用OneClick-macOS-Simple-KVM实现跨平台虚拟机部署与优化 3分钟上手！手柄宏录制让你告别90%重复操作 Windows系统级安卓设备连接与驱动配置解决方案 7个技巧教你用Rufus制作启动盘：从入门到精通的系统安装解决方案 5分钟掌握foobox-cn兼容性指南：从安装到功能适配全解析突破边界：TrackWeight如何让MacBook触控板变身精度电子秤的隐藏潜能

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

Ascend Extension for PyTorch

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端