Azure-Samples/azure-search-openai-demo项目部署优化实践

2025-05-31 14:56:09作者：庞队千Virginia

A sample app for the Retrieval-Augmented Generation pattern running in Azure, using Azure AI Search for retrieval and Azure OpenAI large language models to power ChatGPT-style and Q&A experiences.

项目地址：https://gitcode.com/GitHub_Trending/az/azure-search-openai-demo

在Azure-Samples/azure-search-openai-demo项目的实际使用过程中，许多开发者反馈遇到了部署时间过长的问题。本文将深入分析这一现象的技术原因，并提供相应的优化建议。

部署时间过长的技术分析

根据项目维护者的说明，部署时间延长主要源于两个技术层面的改进：

部署状态监控机制优化：新版本的azd CLI现在会等待Azure App Service部署状态API返回"success"后才显示部署完成。这一改进虽然增加了5-10分钟的等待时间，但确保了部署结果的准确性，避免了早期版本中"虚假成功"的问题。
依赖包体积增大：为支持用户上传功能，项目现在包含了所有数据摄取所需的Python包。这使得pip安装步骤耗时显著增加。特别是像BeautifulSoup这样的可选依赖，即使不使用相关功能也会被安装。

实际部署中的异常情况

部分开发者在部署过程中观察到如下提示信息：

Deploying service backend (Deployment with tracking status failed to start within the allotted time.Resuming deployment without tracking status.)

这表明部署状态跟踪功能未能正常启动，系统将在不跟踪状态的情况下继续部署。这种情况下，虽然终端可能显示"成功"，但实际应用可能尚未完全就绪。

优化部署时间的实用技巧

精简依赖项：对于不使用用户上传功能的生产环境，可以定制requirements.txt文件，移除不必要的依赖包如BeautifulSoup等。
手动监控部署：通过Azure门户直接监控Web应用的"Last deployment"状态，当显示成功后，可手动终止终端中的部署进程。
服务启停策略：在部署前停止Web应用，部署完成后再启动，可减少总体等待时间。
区域选择优化：使用如eastus2等部署速度较快的Azure区域。

项目的最新改进

值得注意的是，项目现已默认使用Container Apps作为部署目标，相比传统的App Service具有更快的部署速度。这一架构变更将显著改善开发者的部署体验。

总结

部署时间优化是一个平衡可靠性和效率的过程。开发者可以根据自身需求，选择性地应用上述优化策略。随着项目架构向Container Apps的迁移，部署效率问题将得到根本性改善。建议开发者关注项目更新，及时迁移到最新架构以获得最佳体验。

azure-search-openai-demo

A sample app for the Retrieval-Augmented Generation pattern running in Azure, using Azure AI Search for retrieval and Azure OpenAI large language models to power ChatGPT-style and Q&A experiences.

项目地址：https://gitcode.com/GitHub_Trending/az/azure-search-openai-demo

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。