LlamaIndex项目中使用非OpenAI模型的技术实践

2025-05-02 04:51:53作者：范垣楠Rhoda

在LlamaIndex项目中，开发者经常会遇到需要替换默认OpenAI模型的情况。本文将通过一个典型场景，详细介绍如何正确配置LlamaIndex以使用DeepSeek等非OpenAI模型。

问题背景

当开发者尝试在LlamaIndex中使用DeepSeek模型替代OpenAI时，即使已经设置了全局LLM模型，系统仍然会调用OpenAI API并导致配额错误。这实际上是因为对LlamaIndex的模型配置机制理解不够全面所致。

技术原理

LlamaIndex的文档处理流程涉及两种核心模型：

LLM模型：负责生成自然语言响应，处理用户查询
Embedding模型：负责将文档内容转换为向量表示，用于索引和检索

默认情况下，LlamaIndex会同时使用OpenAI的LLM和Embedding模型。仅替换LLM模型而不更改Embedding模型配置，系统仍会尝试调用OpenAI的Embedding服务。

完整解决方案

要完全避免使用OpenAI服务，需要同时配置LLM和Embedding模型。以下是使用DeepSeek LLM和HuggingFace Embedding的完整示例：

from llama_index.llms.deepseek import DeepSeek
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core import Settings, VectorStoreIndex, SimpleDirectoryReader

# 配置DeepSeek作为LLM
llm = DeepSeek(model="deepseek-chat", api_key="your_api_key")
Settings.llm = llm

# 配置HuggingFace Embedding模型
Settings.embed_model = HuggingFaceEmbedding(
    model_name="BAAI/bge-small-en-v1.5"
)

# 文档加载和索引构建
documents = SimpleDirectoryReader("data").load_data()
index = VectorStoreIndex.from_documents(documents)

# 查询处理
query_engine = index.as_query_engine()
response = query_engine.query("查询内容")
print(response)