Google.Cloud.AIPlatform.V1Beta1 1.0.0-beta21版本发布：增强GPU多主机支持与模型版本控制

2025-07-08 21:09:12作者：卓艾滢Kingsley

Google.Cloud.AIPlatform.V1Beta1是Google Cloud提供的AI平台客户端库的Beta版本，它为开发者提供了与Google Cloud AI服务交互的能力。这个库属于Google Cloud .NET客户端库系列，专门用于在.NET环境中构建和部署机器学习模型。

本次发布的1.0.0-beta21版本带来了几项重要改进，主要集中在GPU资源管理和模型部署控制方面。这些改进使得开发者在构建和部署AI应用时能够更灵活地配置计算资源，并更好地控制模型版本。

多主机GPU支持增强

新版本引入了multihost_gpu_node_count参数，这是一个重要的功能增强，它允许开发者在Vertex SDK中配置多主机GPU支持。在多主机GPU配置下，AI工作负载可以跨多个物理主机分布，利用多台机器的GPU资源来加速计算密集型任务。

这一特性特别适合需要大规模并行计算的应用场景，如：

通过multihost_gpu_node_count参数，开发者可以精确指定需要使用的GPU主机数量，从而更灵活地分配计算资源，优化性能和成本。

新版本增加了对Model Garden模型版本ID的显式指定支持。Model Garden是Google Cloud提供的模型库，包含各种预训练模型。现在，开发者可以直接指定要使用的模型版本ID，这带来了几个优势：

另一个值得注意的改进是增加了对Hugging Face模型缓存使用的控制选项。Hugging Face是流行的开源模型库，许多AI应用都会使用其中的模型。新版本允许开发者选择是否使用Hugging Face模型缓存，这为模型管理提供了更大的灵活性：

这些新特性为AI应用开发带来了更多可能性，但也需要考虑一些最佳实践：

这个Beta版本的发布展示了Google Cloud AI平台在资源管理和模型控制方面的持续改进，为开发者提供了更强大、更灵活的工具来构建和部署AI解决方案。随着这些功能的稳定，我们可以期待它们在未来成为AI应用开发的标准实践。

登录后查看全文