ASP.NET Extensions中FunctionCallingChatClient的令牌使用统计问题解析

2025-06-28 01:10:34作者：乔或婵

在ASP.NET Extensions项目的AI功能模块中，FunctionCallingChatClient组件在处理函数调用时存在一个令牌使用量统计不准确的技术问题。本文将深入分析该问题的技术背景、产生原因以及解决方案。

问题背景

FunctionCallingChatClient是ASP.NET Extensions中负责处理AI聊天功能与函数调用交互的核心组件。当AI模型需要调用外部函数时，该组件会协调多次内部请求来完成整个交互流程。

在实现过程中，开发团队发现了一个关键问题：组件未能正确累加多次内部请求的令牌使用量，导致最终返回的UsageData信息不完整。令牌使用量统计对于AI应用至关重要，它直接关系到API调用成本的计算和资源使用监控。

技术原理分析

在AI聊天交互中，当模型决定调用外部函数时，通常需要以下步骤：

初始请求：用户发送消息到聊天客户端
函数调用请求：模型决定调用函数并返回函数调用指令
函数执行：系统执行指定函数
结果返回：将函数执行结果返回给模型
最终响应：模型基于函数结果生成最终响应

每个步骤都会消耗一定数量的令牌（tokens），包括输入令牌和输出令牌。FunctionCallingChatClient需要将这些分散在多轮交互中的令牌使用量准确累加，才能提供完整的使用统计。

问题根源

原始实现中存在两个主要技术缺陷：

非流式处理模式下，中间请求的ChatCompletion对象被丢弃，导致其包含的UsageData信息丢失
流式处理模式下虽然能获取每次请求的UsageContent，但缺乏统一的聚合机制

特别是对于非流式处理，由于只保留了最终ChatCompletion对象的UsageData，而忽略了中间步骤的令牌消耗，导致统计结果明显低于实际使用量。

解决方案演进

开发团队考虑了两种不同的解决思路：

统一聚合方案：移除流式处理中的中间UsageContent，最后生成一个汇总所有步骤的UsageContent
内容保留方案：确保所有中间Chat消息（包括函数调用内容）都包含UsageContent，并正确添加到历史记录中

经过深入讨论，团队最终选择了第一种方案，主要基于以下考虑：

某些AI服务提供的AdditionalProperties中包含无法解析的额外统计信息
统一聚合更能准确反映整体资源消耗
与用户期望的行为更加一致

实现细节

最终的解决方案包含以下关键技术点：

在FunctionCallingChatClient内部维护令牌使用量的累加器
每次内部请求完成后，将其UsageData信息累加到总量中
最终响应时，将累加结果设置到返回对象的UsageData属性
确保流式和非流式处理模式下行为一致

这种实现方式不仅修复了原始问题，还提高了组件在不同处理模式下行为的一致性，为用户提供了更可靠的令牌使用统计。

总结

ASP.NET Extensions团队对FunctionCallingChatClient的这次改进，展示了他们对细节的关注和对用户体验的重视。通过准确统计令牌使用量，开发者现在可以更精确地监控和控制AI功能的资源消耗，为构建高效、经济的AI应用提供了更好的基础支持。

这个问题的高效解决也体现了ASP.NET Extensions项目的成熟度和响应速度，为开发者社区提供了更可靠的AI集成方案。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

471

465

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

2.09 K

217