在dotnet/extensions项目中处理MEAI输出数据大小限制的最佳实践

2025-06-27 04:05:40作者：幸俭卉

背景介绍

在开发基于MEAI(Microsoft Extensions for AI)的应用程序时，开发者经常会遇到输入令牌(token)数量超过模型限制的问题。这种情况通常发生在长时间对话或大量函数调用返回大量信息时。本文将深入探讨如何有效管理和优化MEAI中的输出数据大小。

核心问题分析

当使用MEAI进行AI交互时，系统会自动将函数调用的结果添加回对话历史中。随着对话的深入，累积的上下文信息可能会超出模型的最大令牌限制，导致错误。这需要我们找到合适的切入点来干预和控制数据流。

解决方案详解

1. 自定义IChatClient实现

MEAI提供了灵活的管道机制，开发者可以在FunctionInvokingChatClient之后插入自定义的IChatClient实现。这种方式允许我们在数据发送到AI模型前进行拦截和处理。

// 示例代码：自定义IChatClient实现
public class TokenLimitingChatClient : IChatClient
{
    private readonly IChatClient _innerClient;
    private readonly int _maxTokens;

    public TokenLimitingChatClient(IChatClient innerClient, int maxTokens)
    {
        _innerClient = innerClient;
        _maxTokens = maxTokens;
    }

    public async Task<IReadOnlyList<ChatMessage>> CompleteChatAsync(
        ChatHistory chatHistory, 
        CompleteChatOptions options, 
        CancellationToken cancellationToken)
    {
        // 在这里实现令牌计数和限制逻辑
        var limitedHistory = LimitTokens(chatHistory, _maxTokens);
        return await _innerClient.CompleteChatAsync(limitedHistory, options, cancellationToken);
    }
    
    private ChatHistory LimitTokens(ChatHistory history, int maxTokens)
    {
        // 实现令牌限制逻辑
        // ...
    }
}

2. 继承FunctionInvokingChatClient

更精细的控制可以通过继承FunctionInvokingChatClient并重写其关键方法来实现：

public class CustomFunctionInvokingChatClient : FunctionInvokingChatClient
{
    protected override IReadOnlyList<ChatMessage> CreateResponseMessages(
        ChatHistory chatHistory, 
        FunctionCall functionCall, 
        FunctionResult functionResult)
    {
        // 在创建响应消息前进行自定义处理
        var modifiedResult = ProcessFunctionResult(functionResult);
        return base.CreateResponseMessages(chatHistory, functionCall, modifiedResult);
    }
}

3. 使用Terminate控制流程

函数调用可以通过设置Terminate标志来中断自动调用流程，让调用者有调整的机会：

// 在函数实现中
context.Terminate = true;

令牌计数技术

为了有效管理令牌数量，我们需要准确计算文本对应的令牌数。对于OpenAI模型，可以使用Microsoft.ML.Tokenizers中的TiktokenTokenizer：

using Microsoft.ML.Tokenizers;

var tokenizer = Tokenizer.CreateTiktokenForModel("gpt-4");
var text = "需要计算令牌数的文本";
var tokens = tokenizer.Encode(text);
var tokenCount = tokens.Count;