首页
/ ModelContextProtocol工具调用结果展示优化方案解析

ModelContextProtocol工具调用结果展示优化方案解析

2025-07-01 23:59:13作者:裘晴惠Vivianne

在ModelContextProtocol(MCP)协议的实际应用中,工具调用结果的展示方式存在一个明显的用户体验问题。当前协议中工具标题是静态的,导致客户端只能显示通用操作名称(如"访问网页"),而无法展示具体的操作细节(如"访问了https://example.com")。这种展示方式在多步骤代理流程中尤其影响用户体验,使得用户难以直观了解每个步骤的具体执行情况。

问题背景分析

在浏览器自动化等场景中,工具执行后产生的实际结果往往比静态标题包含更多有价值的信息。例如:

  • 网页访问:实际访问的具体URL
  • 点击操作:实际点击的元素选择器
  • 表单提交:实际填写的字段内容

目前的MCP协议设计将这些详细信息隐藏在返回内容中,而客户端只能显示预设的通用标题,这造成了信息展示的不对称。

技术解决方案探讨

核心改进方案

建议在CallToolResult接口中新增一个message字段,专门用于存储工具调用的结果摘要。这个字段具有以下特点:

  1. 专为用户界面设计,不传递给语言模型
  2. 动态生成,可以包含具体操作细节
  3. 简洁明了,适合在操作日志中显示

替代方案比较

  1. 进度通知方案:通过ProgressNotification传递状态信息,但存在同步问题
  2. 专用内容类型:作为content的一部分,但会不必要地传递给语言模型
  3. 客户端摘要生成:增加额外成本,可能造成显示延迟

深入技术讨论

在后续讨论中,技术专家提出了几个关键考量点:

  1. 内容与消息的区分:工具返回的原始数据(如页面URL、标题、快照)应作为content,而操作摘要应作为message
  2. 模型输入优化:避免将重复信息传递给语言模型,节省token消耗
  3. 现有协议扩展性:讨论了利用现有annotations.audience属性的可能性

最佳实践建议

基于讨论结果,对于需要在MCP协议中实现详细工具调用展示的场景,建议:

  1. 优先考虑使用annotations.audience属性标记用户专用内容
  2. 对于需要特殊展示格式的场景,可考虑扩展annotations.disposition属性
  3. 工具实现应保持消息简洁,同时确保包含足够的关键操作信息

这种改进将显著提升多步骤自动化流程的可观察性,使用户能够更直观地理解系统执行的具体操作,同时也保持了协议的精简性和扩展性。

登录后查看全文
热门项目推荐
相关项目推荐