Azure-Samples/azure-search-openai-demo项目新增推理模型支持与令牌使用统计功能

2025-06-09 10:22:45作者：宣利权Counsellor

azure-search-openai-demo

A sample app for the Retrieval-Augmented Generation pattern running in Azure, using Azure AI Search for retrieval and Azure OpenAI large language models to power ChatGPT-style and Q&A experiences.

项目地址：https://gitcode.com/GitHub_Trending/az/azure-search-openai-demo

项目概述

Azure-Samples/azure-search-openai-demo是一个展示如何将Azure搜索服务与OpenAI模型集成的开源项目。该项目提供了一个完整的解决方案，帮助开发者构建基于检索增强生成（RAG）架构的智能问答系统。通过结合Azure搜索的强大检索能力和OpenAI的语言理解与生成能力，开发者可以快速搭建出能够理解复杂查询并提供准确回答的AI应用。

推理模型支持

在最新版本中，项目新增了对推理模型（o1和o3-mini）的支持。推理模型是专门为需要复杂逻辑推理和深入分析的场景设计的AI模型。与传统的语言模型相比，推理模型在处理需要多步思考的问题时表现更优。

开发者现在可以在项目配置中选择使用推理模型，并根据需求调整推理强度（低/中/高）。不同的推理强度会影响模型的思考深度和处理时间：

低强度：适用于简单推理任务，响应速度快
中强度：平衡推理深度和响应速度
高强度：进行最深入的推理分析，适合复杂问题

需要注意的是，推理模型通常会引入额外的处理延迟，因为模型需要时间进行"思考"。因此，对于大多数基于检索增强生成（RAG）的应用场景，传统模型可能仍然是更合适的选择。推理模型更适合那些需要深入分析而非简单信息检索的特殊场景。

令牌使用统计功能

新版本还增加了令牌使用统计功能，开发者现在可以在"思考过程"选项卡中查看每次交互消耗的令牌数量。令牌是AI模型处理文本的基本单位，了解令牌使用情况对于：

成本控制：OpenAI API通常按令牌数计费
性能优化：令牌数与处理时间通常成正比
查询优化：识别可能导致高消耗的查询模式

这一功能使得开发者能够更好地监控和管理AI资源的使用情况，为应用优化提供数据支持。

其他改进

除了上述主要功能外，本次更新还包括多项改进：

性能优化：减少了不必要的资源消耗，提升了系统响应速度
Windows兼容性增强：解决了在Windows环境下的运行问题
部署流程简化：改进了部署脚本，使安装配置更加顺畅
依赖项更新：升级了相关SDK包，移除了不再需要的依赖

技术实现建议

对于考虑使用推理模型的开发者，建议：

先在小规模数据集上测试不同推理强度的效果
监控响应时间和准确率的平衡
根据实际业务需求选择最合适的模型和强度
对于大多数信息检索场景，传统模型可能已经足够
利用令牌统计功能优化提示词设计，减少不必要的令牌消耗

这些新功能的加入使得Azure-Samples/azure-search-openai-demo项目在AI应用开发方面提供了更丰富的选择和更完善的可观测性，帮助开发者构建更加智能和高效的解决方案。

azure-search-openai-demo

A sample app for the Retrieval-Augmented Generation pattern running in Azure, using Azure AI Search for retrieval and Azure OpenAI large language models to power ChatGPT-style and Q&A experiences.

项目地址：https://gitcode.com/GitHub_Trending/az/azure-search-openai-demo

登录后查看全文

项目优选

收起

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

昇腾LLM分布式训练框架

flutter_flutter

TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。

ohos_react_native

React Native鸿蒙化仓库