Vercel AI 项目深度解析：Google Vertex 模型思考过程提取功能实现

2025-05-16 15:56:14作者：薛曦旖Francesca

The AI Toolkit for TypeScript. From the creators of Next.js, the AI SDK is a free open-source library for building AI-powered applications and agents

项目地址：https://gitcode.com/GitHub_Trending/ai/ai

在人工智能应用开发领域，模型推理过程的可解释性一直是开发者关注的重点。近期，Vercel AI 项目针对 Google Vertex AI 服务中的 Gemini 模型推出了思考过程提取功能，这项创新为开发者提供了更深入的模型行为洞察能力。

技术背景

传统的大语言模型交互中，开发者通常只能获取模型的最终输出结果。而新一代的 Gemini 模型通过"思考令牌"(thinking tokens)机制，能够将模型的内部推理过程可视化。这种机制类似于人类解决问题的思维过程，模型会在生成最终答案前展示其思考路径。

功能实现原理

在技术实现层面，该功能主要通过以下两个关键配置参数实现：

thinkingBudget：控制模型用于内部思考的最大token数量
includeThoughts：布尔值开关，决定是否在响应中包含思考过程

当启用思考过程提取时，Vertex AI 的响应会包含特殊的标记数据。这些响应分为两种格式：

流式响应格式

在流式传输模式下，思考内容会以独立的数据块形式返回，包含"thought": true的标识字段。这使得客户端能够实时区分常规输出和思考过程。

非流式响应格式

在完整响应中，思考内容与常规输出会合并在一个parts数组中，通过thought字段进行区分。这种结构设计既保持了数据完整性，又便于后续处理。

技术实现细节

在实际应用中，开发者可以通过配置providerOptions来启用这一功能：

providerOptions: {
  google: {
    thinkingConfig: {
      thinkingBudget: 2048,
      includeThoughts: true
    }
  }
}

服务端接收到配置后，会将其转换为Vertex AI API所需的请求格式。关键点在于确保includeThoughts参数能够正确传递到最终API调用中。

响应处理逻辑需要特别关注usageMetadata中的thoughtsTokenCount字段，这个数值反映了模型用于内部思考的token消耗量，对于成本控制和性能优化具有重要意义。

应用价值

这项功能的实际价值体现在多个方面：

调试辅助：开发者可以观察模型的思考路径，更容易定位问题
用户体验：可以设计更人性化的交互，如显示"模型正在思考..."等状态
成本优化：通过分析thoughtsTokenCount，可以更精确地计算和优化token使用
教育价值：帮助学生和初学者理解大语言模型的工作原理

实现建议

对于想要集成此功能的开发者，建议注意以下几点：

确保使用的Gemini模型版本支持思考过程提取功能
合理设置thinkingBudget，避免不必要的token消耗
在前端界面设计适当的视觉区分，将思考过程与最终输出区别显示
考虑在非调试环境下可能不需要长期开启此功能，以节省资源

这项功能的加入标志着Vercel AI在模型可解释性方面迈出了重要一步，为开发者提供了更强大的工具来理解和优化AI应用行为。随着技术的不断发展，我们期待看到更多类似的透明化功能出现，进一步降低AI技术的使用门槛。

The AI Toolkit for TypeScript. From the creators of Next.js, the AI SDK is a free open-source library for building AI-powered applications and agents

项目地址：https://gitcode.com/GitHub_Trending/ai/ai

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

413

339

cherry-studio

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

Vercel AI 项目深度解析：Google Vertex 模型思考过程提取功能实现

技术背景

功能实现原理

流式响应格式

非流式响应格式

技术实现细节

应用价值

实现建议

热门内容推荐

最新内容推荐

项目优选

Vercel AI 项目深度解析：Google Vertex 模型思考过程提取功能实现

技术背景

功能实现原理

流式响应格式

非流式响应格式

技术实现细节

应用价值

实现建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选