Vercel AI SDK 对 Google Vertex AI 中 Gemini 2.5 思考预算的支持

2025-05-16 17:48:35作者：段琳惟

项目地址：https://gitcode.com/gh_mirrors/ai1/ai

在最新发布的 Gemini 2.5 模型中，Google 引入了一个称为"思考预算"(thinking budget)的创新功能。这个功能允许开发者控制模型在生成响应前的内部推理过程。本文将深入探讨这一特性在 Vercel AI SDK 中的实现细节，特别是针对 Google Vertex AI 生产环境的使用场景。

思考预算的工作原理

思考预算本质上是一种计算资源分配机制。当开发者设置一个思考预算值时，模型会在这个限制范围内进行内部推理和思考。预算值越高，模型就有更多的"思考时间"来优化其响应质量；设置为0则完全禁用这一过程。

在技术实现上，思考预算通过控制模型内部的推理步骤(token)数量来工作。每个推理步骤都消耗一定的计算资源，设置预算就是限制这些步骤的总数。

Vercel AI SDK 的实现差异

Vercel AI SDK 提供了两个不同的Google模型集成包：@ai-sdk/google 和 @ai-sdk/google-vertex。最初，思考预算功能仅在@ai-sdk/google中实现，而生产环境常用的Vertex AI集成包缺少这一关键功能。

这种差异导致了开发者在迁移到生产环境时遇到兼容性问题。虽然Google的原生SDK已经支持思考预算配置，但Vertex AI的API接口并未直接暴露这一功能。

解决方案与技术实现

Vercel团队通过以下方式解决了这一问题：

在@ai-sdk/google-vertex包中实现了与@ai-sdk/google相同的思考预算接口
确保配置选项的一致性，开发者可以使用相同的语法在两个环境中工作
底层适配Vertex AI的API限制，即使原生API不直接支持思考预算功能

开发者现在可以在Vertex AI环境中使用如下配置：

const { text } = await generateText({
  model: google('gemini-2.5-pro-preview'),
  providerOptions: {
    google: {
      thinkingConfig: {
        thinkingBudget: 2048, // 可根据需求调整
      },
    },
  },
  // 其他参数...
});