Azure-Samples/azure-search-openai-demo 项目中的 OpenAI 模型升级指南

2025-06-01 14:16:23作者：庞眉杨Will

azure-search-openai-demo

A sample app for the Retrieval-Augmented Generation pattern running in Azure, using Azure AI Search for retrieval and Azure OpenAI large language models to power ChatGPT-style and Q&A experiences.

项目地址：https://gitcode.com/GitHub_Trending/az/azure-search-openai-demo

在 Azure-Samples/azure-search-openai-demo 项目中，开发者可能会遇到需要将已部署的 OpenAI 模型从 gpt-35-turbo 升级到 gpt-4 的情况。本文将详细介绍这一过程中的关键步骤和注意事项。

模型升级的核心问题

当尝试直接修改部署模型时，系统会返回错误信息："CannotChangeDeploymentModel: The model of deployment cannot be changed"。这是因为 Azure OpenAI 服务不允许直接修改现有部署的模型类型，这是平台的设计限制。

正确的升级流程

删除原有部署
首先需要在 Azure AI Studio 中删除原有的 gpt-35-turbo 模型部署。这是必要的步骤，因为 Azure 不允许直接修改已部署模型的类型。
设置新的部署名称
使用以下命令设置新的部署名称：
```
azd env set AZURE_OPENAI_CHATGPT_DEPLOYMENT chat4
```
这里的"chat4"可以替换为任何你喜欢的部署名称，但必须与后续配置保持一致。
修改模型配置
在项目的 main.bicep 文件中，需要修改以下参数：
```
param chatGptModelName string = (openAiHost == 'azure') ? 'gpt-4' : 'gpt-4'
```
处理模型版本
如果使用 gpt-4 的特定版本（如 0125-Preview），需要注意版本号的格式：
```
param chatGptModelVersion string = '0125-Preview'
```
特别注意版本号中的大小写，如"Preview"的首字母必须大写。

常见问题解决方案

部署失败问题
如果遇到"DeploymentModelNotSupported"错误，请检查：
- 确保模型名称和版本号完全匹配
- 确认你的订阅和区域支持所选的模型
- 检查版本号的大小写是否正确
性能注意事项
gpt-4 模型的响应时间通常比 gpt-35-turbo 长，平均可能达到45秒左右。这是模型复杂度增加带来的正常现象，同时也会带来回答质量的显著提升。
环境配置
建议不要直接修改 main.parameters.json 文件，而是通过 azd env set 命令来设置环境变量，这样可以避免配置冲突。

最佳实践建议

在升级模型前，先在 Azure OpenAI Studio 中确认目标模型在你的区域是否可用。
考虑创建一个全新的环境进行测试，避免影响现有生产环境。
记录下原有的配置参数，以便在需要时可以快速回滚。
升级完成后，进行充分的测试，特别是关注API响应时间和资源消耗情况。

通过遵循上述步骤和注意事项，开发者可以顺利完成 Azure-Samples/azure-search-openai-demo 项目中的 OpenAI 模型升级工作。

azure-search-openai-demo

A sample app for the Retrieval-Augmented Generation pattern running in Azure, using Azure AI Search for retrieval and Azure OpenAI large language models to power ChatGPT-style and Q&A experiences.

项目地址：https://gitcode.com/GitHub_Trending/az/azure-search-openai-demo

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统