ASP.NET Extensions项目中的AI模型元数据设计演进

2025-06-27 16:21:00作者：庞眉杨Will

extensions

项目地址：https://gitcode.com/gh_mirrors/exte/Extensions

在ASP.NET Extensions项目中，开发团队正在对AI相关功能进行重要改进，特别是围绕模型元数据的设计进行了深入讨论和优化。本文将详细介绍这一演进过程及其技术考量。

背景与需求

在AI应用开发中，客户端需要了解底层模型的能力和特性，以便做出最佳决策。例如，一个聊天客户端可能需要知道当前模型是否支持原生JSON模式输出，或者一个嵌入生成器需要了解默认的向量维度数。这些信息对于构建健壮且高效的AI应用至关重要。

现有设计的局限性

当前实现中存在几个关键限制：

元数据概念过于简单，仅包含基本属性如ModelId和Dimensions
无法区分提供者级别和模型级别的元数据
缺乏对模型特定能力的动态查询机制
同步API设计限制了从远程服务获取最新信息的能力

新设计方案

团队提出了一个分层的元数据设计方案：

提供者元数据

保留现有的ChatClientMetadata和EmbeddingGeneratorMetadata类，但进行以下改进：

添加ProviderName和ProviderUri属性
将ModelId重命名为DefaultModelId以更准确表达其含义
新增GetModelMetadataAsync方法用于查询特定模型的详细信息

模型元数据

引入新的ChatModelMetadata和EmbeddingModelMetadata类：

public class ChatModelMetadata
{
    public bool? SupportsNativeJsonSchema { get; }
    // 未来可扩展更多属性
}

public class EmbeddingModelMetadata
{
    public int? Dimensions { get; }
    // 未来可扩展更多属性
}

这些类设计为可扩展的，允许第三方添加特定于其实现的属性。

技术考量与决策

在实现过程中，团队面临并解决了几个关键问题：

同步vs异步API：最终选择了异步设计，以支持从远程服务获取元数据，同时要求实现者自行处理缓存。
缓存策略：决定不强制统一缓存机制，而是让各实现根据自身特点选择最适合的缓存方式。
中间件交互：明确元数据应反映底层提供者的真实能力，而非中间件修改后的状态。
可扩展性：通过允许子类化和nullable属性，确保设计能适应未来各种模型和提供者的特性。

实际应用示例

开发者现在可以这样使用新的元数据系统：

var chatClient = services.GetRequiredService<IChatClient>();
var metadata = chatClient.GetMetadata();
var modelMetadata = await metadata.GetModelMetadataAsync("gpt-4");

if (modelMetadata.SupportsNativeJsonSchema == true)
{
    // 使用原生JSON模式优化功能调用
}