ModelContextProtocol C SDK 中自定义 JSON Schema 生成的实践指南
在开发基于 ModelContextProtocol (MCP) 的工具时,正确处理输入参数的 JSON Schema 定义对于 AI 代理理解数据类型至关重要。本文将深入探讨如何在 C# SDK 中自定义 JSON Schema 生成,特别是处理 .NET 特有的日期时间类型。
背景与挑战
当开发者定义 MCP 工具时,输入参数的 Schema 会自动生成。对于包含 .NET 特有类型(如 DateTime、DateTimeOffset 和 TimeSpan)的输入类,默认生成的 Schema 可能不足以清晰表达这些类型的语义。
例如,对于以下输入类:
public class TemporalData
{
[JsonPropertyName("dateTimeValue")]
public DateTime DateTimeValue { get; set; }
[JsonPropertyName("dateTimeOffsetValue")]
public DateTimeOffset DateTimeOffsetValue { get; set; }
[JsonPropertyName("timeSpanValue")]
public TimeSpan TimeSpanValue { get; set; }
}
默认生成的 Schema 中,只有 TimeSpan 类型会带有注释说明其 .NET 类型信息,而 DateTime 和 DateTimeOffset 则缺乏足够的元数据描述。
解决方案
1. 使用 TransformSchemaNode 自定义 Schema
对于动态创建的工具,可以通过 SchemaCreateOptions 的 TransformSchemaNode 回调来自定义 Schema 生成:
var tool = McpServerTool.Create((TemporalData input) => "received data", new()
{
SchemaCreateOptions = new()
{
TransformSchemaNode = (ctx, node) =>
{
Type? t = ctx.PropertyInfo?.PropertyType;
if (t == typeof(DateTime) || t == typeof(DateTimeOffset))
{
node["format"] = "date-time";
}
else if (t == typeof(TimeSpan))
{
node["format"] = "duration";
}
return node;
},
},
});
这种方法可以灵活地为特定类型添加格式(format)信息,使生成的 Schema 更加精确。
2. 内置类型映射改进
最新版本的 SDK 已经内置了对常见 .NET 类型的支持,包括:
- DateTime 和 DateTimeOffset 会被标记为 "date-time" 格式
- TimeSpan 会被标记为 "duration" 格式
这些改进使得 Schema 生成更加符合 JSON Schema 规范,无需开发者额外配置。
3. 静态工具方法的限制与替代方案
对于使用 [McpServerTool] 属性标记的静态方法,目前不支持直接通过属性参数来自定义 Schema 生成。开发者可以考虑以下替代方案:
- 改用动态工具创建方式,获得更细粒度的控制
- 创建自定义工具包装器,继承或组合现有的工具实例
- 实现自己的工具发现和注册逻辑,替代属性标记方式
最佳实践建议
- 优先使用最新版本:确保使用包含内置类型映射改进的 SDK 版本
- 明确类型语义:对于自定义类型,考虑添加格式(format)和注释(comment)信息
- 保持一致性:在整个项目中采用统一的 Schema 自定义策略
- 文档化约定:记录团队对特殊类型的处理方式,便于维护
总结
ModelContextProtocol C# SDK 提供了多种方式来定制 JSON Schema 生成,从简单的回调函数到内置的类型映射支持。理解这些机制可以帮助开发者创建更精确、更易于 AI 代理理解的工具接口定义。对于需要精细控制的场景,推荐使用动态工具创建方式;而对于简单用例,则可以依赖 SDK 的内置支持。
随着 SDK 的不断演进,未来可能会提供更多便捷的方式来定制 Schema 生成,开发者应保持对更新日志的关注,及时采用新的最佳实践。
kernelopenEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。C094
baihu-dataset异构数据集“白虎”正式开源——首批开放10w+条真实机器人动作数据,构建具身智能标准化训练基座。00
mindquantumMindQuantum is a general software library supporting the development of applications for quantum computation.Python058
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
GLM-4.7GLM-4.7上线并开源。新版本面向Coding场景强化了编码能力、长程任务规划与工具协同,并在多项主流公开基准测试中取得开源模型中的领先表现。 目前,GLM-4.7已通过BigModel.cn提供API,并在z.ai全栈开发模式中上线Skills模块,支持多模态任务的统一规划与协作。Jinja00
AgentCPM-Explore没有万亿参数的算力堆砌,没有百万级数据的暴力灌入,清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合研发的 AgentCPM-Explore 智能体模型基于仅 4B 参数的模型,在深度探索类任务上取得同尺寸模型 SOTA、越级赶上甚至超越 8B 级 SOTA 模型、比肩部分 30B 级以上和闭源大模型的效果,真正让大模型的长程任务处理能力有望部署于端侧。Jinja00