在YOSO-ai项目中使用Azure OpenAI API的配置指南

2025-05-11 12:07:35作者：舒璇辛Bertina

概述

本文将详细介绍如何在YOSO-ai项目中配置和使用Azure OpenAI API服务。YOSO-ai是一个基于Python的开源项目，它提供了智能网页抓取和数据处理能力。通过集成Azure OpenAI服务，可以显著增强其自然语言处理能力。

环境变量配置

要成功使用Azure OpenAI API，首先需要正确设置以下环境变量：

AZURE_OPENAI_ENDPOINT - Azure OpenAI服务的终结点URL
AZURE_OPENAI_CHAT_DEPLOYMENT_NAME - 聊天模型的部署名称
MODEL_NAME - 使用的模型名称
AZURE_OPENAI_API_KEY - API访问密钥
OPENAI_API_TYPE - 设置为"azure"表示使用Azure服务
AZURE_OPENAI_API_VERSION - API版本号
AZURE_OPENAI_EMBEDDINGS_DEPLOYMENT_NAME - 嵌入模型的部署名称

这些变量通常存储在项目根目录下的.env文件中，并通过python-dotenv库加载：

from dotenv import load_dotenv
load_dotenv()

模型实例化

在YOSO-ai项目中，需要实例化两个主要的Azure OpenAI模型：

1. 聊天模型实例化

from langchain_openai import AzureChatOpenAI

llm_model_instance = AzureChatOpenAI(
    openai_api_version=os.environ["AZURE_OPENAI_API_VERSION"],
    azure_deployment=os.environ["AZURE_OPENAI_CHAT_DEPLOYMENT_NAME"],
)

2. 嵌入模型实例化

from langchain_openai import AzureOpenAIEmbeddings

embedder_model_instance = AzureOpenAIEmbeddings(
    openai_api_version=os.environ["AZURE_OPENAI_API_VERSION"],
    azure_deployment=os.environ["AZURE_OPENAI_EMBEDDINGS_DEPLOYMENT_NAME"],
)

图形配置

将实例化的模型整合到YOSO-ai的图形配置中：

graph_config = {
    "llm": {
        "model_instance": llm_model_instance,
    },
    "embeddings": {
        "model_instance": embedder_model_instance,
    }
}

常见问题解决

环境变量缺失错误

如果遇到类似KeyError: 'AZURE_OPENAI_EMBEDDINGS_DEPLOYMENT_NAME'的错误，表明系统无法找到所需的环境变量。解决方法包括：

检查.env文件是否存在且包含所有必需的变量
确认变量名称拼写正确
确保在访问环境变量前已正确加载.env文件

部署名称不匹配

确保在Azure门户中创建的部署名称与.env文件中指定的名称完全一致，包括大小写。

实际应用示例

以下是一个完整的智能网页抓取示例，展示了如何将Azure OpenAI服务集成到YOSO-ai项目中：

from scrapegraphai.graphs import SmartScraperGraph

smart_scraper_graph = SmartScraperGraph(
    prompt="列出所有项目及其描述",
    source="https://example.com/projects",  # 替换为实际URL
    config=graph_config
)

result = smart_scraper_graph.run()
print(result)

最佳实践

安全性：永远不要将API密钥硬编码在代码中，始终使用环境变量
版本控制：将.env文件添加到.gitignore中，避免敏感信息泄露
错误处理：添加适当的异常处理来捕获和记录配置错误
性能监控：监控API调用次数和响应时间，优化使用效率

通过遵循这些指南，开发者可以顺利地在YOSO-ai项目中集成Azure OpenAI服务，充分利用其强大的自然语言处理能力来增强网页抓取和数据处理功能。

YOSO-ai

Python scraper based on AI

项目地址：https://gitcode.com/gh_mirrors/yo/YOSO-ai

登录后查看全文