Comet-LLM项目中的自定义LLM调用成本追踪实践

2025-06-01 04:31:10作者：平淮齐Percy

Log, Track, and Visualize your LLM Prompts and Chains

项目地址：https://gitcode.com/GitHub_Trending/co/comet-llm

背景介绍

在大型语言模型(LLM)应用开发中，当开发者选择不使用现成的编排框架(如LangChain等)而采用自定义实现时，如何有效追踪LLM调用的token消耗和成本计算成为一个常见挑战。Comet-LLM项目作为一个专业的LLM监控和追踪工具，为这类场景提供了灵活的解决方案。

核心问题分析

在自定义实现的LLM代理(Agent)工作流中，开发者通常会遇到以下问题：

框架集成方案(如Gemini集成)可能无法满足特定的调用分组需求
需要手动记录token使用情况和计算成本
希望将这些监控数据与Comet的追踪功能无缝集成

解决方案详解

Comet-LLM提供了两种主要方式来解决上述问题：

1. 使用@track装饰器手动追踪

通过在关键函数上添加@opik.track装饰器，开发者可以精确控制追踪范围。这种方式特别适合需要自定义分组逻辑的场景：

@opik.track(type="llm")
def custom_llm_call(...):
    # LLM调用逻辑

2. 手动更新Span数据

对于需要更细粒度控制的场景，可以使用update_current_span方法手动记录token和成本信息：

from opik.opik_context import update_current_span

def fake_llm_call(...):
    response = client.generate_content(...)
    
    update_current_span(
        usage={
            "prompt_tokens": input_tokens,
            "completion_tokens": output_tokens,
            "total_tokens": total_tokens,
        },
        total_cost=calculated_cost,
        model="gemini-pro",
        provider="gemini"
    )

高级技巧

成本自动计算：通过同时提供model和provider参数，Comet可以利用内置的定价信息自动计算成本
追踪分组：合理使用@track装饰器的层级结构，可以创建符合业务逻辑的追踪分组
混合模式：可以结合使用框架集成和手动追踪，在复杂场景中获得最佳效果

最佳实践建议

对于简单的自定义实现，优先考虑使用框架集成方案
当集成方案无法满足分组需求时，采用手动@track装饰器方案
在需要记录额外元数据时，使用update_current_span方法
始终提供model和provider信息以获得最佳的成本计算支持

总结

Comet-LLM为自定义LLM实现提供了灵活而强大的监控能力。通过合理使用其提供的装饰器和API，开发者可以在不依赖编排框架的情况下，依然获得完整的调用追踪和成本监控能力。这种灵活性使得Comet-LLM成为各种LLM应用开发场景下的理想监控解决方案。

Log, Track, and Visualize your LLM Prompts and Chains

项目地址：https://gitcode.com/GitHub_Trending/co/comet-llm

登录后查看全文

最新内容推荐

Windows版Redis 5.0.14下载资源：高效内存数据库的完美Windows解决方案 Python Django图书借阅管理系统：高效智能的图书馆管理解决方案 Python开发者的macOS终极指南：VSCode安装配置全攻略 Adobe Acrobat XI Pro PDF拼版插件：提升排版效率的专业利器 LabVIEW串口通信开发全攻略：从入门到精通的完整解决方案操作系统概念第六版PDF资源全面指南：适用场景与使用教程 STM32到GD32项目移植完全指南：从兼容性到实战技巧深入解析Windows内核模式驱动管理器：系统驱动管理的终极利器 Windows Server 2016 .NET Framework 3.5 SXS文件下载与安装完整指南基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统