Google Cloud Java SDK中Vertex AI微调模型调用问题解析

2025-07-06 15:04:58作者：卓艾滢Kingsley

问题背景

在使用Google Cloud Java SDK（google-cloud-vertexai:1.2.0版本）时，开发者遇到了一个关于Vertex AI微调模型调用的问题。当尝试通过GenerativeModel类调用微调后的模型时，系统会抛出InvalidArgumentException异常，导致调用失败。

问题本质

问题的核心在于SDK中资源名称(resourceName)的构造方式。当前实现中，GenerativeModel类固定使用以下格式构建资源名称：

projects/{projectId}/locations/{location}/publishers/google/models/{modelName}

这种格式适用于Google预训练的基础模型，但对于开发者自己微调(fine-tuned)的模型则无效。

技术细节

对于微调模型，正确的端点(endpoint)格式应该是：

projects/{projectId}/locations/{location}/endpoints/{endpointId}

这种差异导致了API调用失败。微调模型在Vertex AI中实际上是作为独立的端点部署的，而不是作为基础模型的一部分。

解决方案

Google Cloud Java SDK团队已经通过PR#10825修复了这个问题。现在开发者可以通过以下方式正确调用微调模型：

使用完整的资源路径作为模型名称：

projects/project_number/locations/location/endpoints/model_id

在创建GenerativeModel实例时直接传入这个完整路径：

new GenerativeModel.Builder().setModelName("projects/project_number/locations/location/endpoints/model_id")

最佳实践

对于使用Vertex AI微调模型的开发者，建议：

始终使用完整的资源路径来引用微调模型
确保project_number、location和model_id参数准确无误
对于新项目，建议使用最新版本的SDK以避免此类问题
在代码中明确区分基础模型和微调模型的调用方式

总结

这个问题展示了云服务API设计中资源定位的重要性。随着AI模型定制化需求的增加，支持微调模型的调用已成为SDK的必要功能。Google Cloud Java SDK团队及时响应并修复了这个问题，为开发者提供了更完整的Vertex AI集成体验。

登录后查看全文