New-API项目中的Token计算优化方案解析

2025-05-31 09:24:36作者：翟江哲Frasier

在API服务开发中，准确计算和传递Token数量是一个关键问题。New-API项目近期针对这一问题进行了重要优化，特别是在处理不同AI模型间Token计算差异的场景下。

背景与挑战

现代AI服务如Claude等模型采用与OpenAI不同的Token计算方式。当New-API直接对接这些模型时，可以获取正确的Token计数。然而，在多级服务架构中，当第二层New-API对接第一层New-API时，Token计算就会出现偏差。

这种偏差源于当前实现中，次级服务会默认使用OpenAI的Token计算方法，而非上游服务返回的实际Token数量。这导致在多级服务场景下，Token统计结果不准确，可能影响计费、配额控制等关键功能。

技术解决方案

New-API项目通过引入stream_options参数来解决这一问题。该方案允许上游服务传递准确的Token计数信息，下游服务则可以直接使用这些数据而非重新计算。

这一设计借鉴了类似项目中的成熟经验，但针对New-API的特定架构进行了优化。实现要点包括：

新增stream_options参数结构体，专门用于传递Token相关元数据
保持向后兼容性，不影响现有接口的正常使用
优化数据流处理逻辑，确保Token信息的高效传递

实现意义

这一优化对New-API项目具有多重价值：

准确性提升：确保在多级服务场景下仍能获取准确的Token计数
性能优化：避免不必要的Token重复计算
扩展性增强：为未来支持更多模型的特定元数据预留了接口
兼容性保障：不影响现有客户端的正常使用

技术展望

随着AI生态的多样化发展，不同模型间的差异会越来越多。New-API的这项优化不仅解决了当前的Token计算问题，还为未来处理其他模型特定元数据提供了可扩展的框架。开发者可以基于此机制，逐步完善对不同AI服务的深度支持。

这项改进体现了New-API项目对开发者需求的快速响应能力，也展示了其在API服务领域的技术前瞻性。随着项目的持续演进，我们可以期待更多类似的优化和创新。

new-api

基于One API的二次开发版本，仅供学习使用！

项目地址：https://gitcode.com/gh_mirrors/ne/new-api

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

114

140