LlamaIndex项目中如何正确配置自定义LLM和Embedding模型

2025-05-02 21:22:16作者：蔡怀权

在基于LlamaIndex构建RAG应用时，开发者经常会遇到需要替换默认模型的情况。本文将以一个典型场景为例，详细介绍如何正确配置自定义的大语言模型(LLM)和文本嵌入(Embedding)模型。

问题背景

当开发者尝试将LlamaIndex的默认OpenAI模型替换为DeepSeek模型时，即使设置了全局LLM参数，系统仍然会调用OpenAI API导致配额错误。这实际上是因为LlamaIndex的工作机制涉及两种不同类型的模型：

大语言模型(LLM)：负责生成自然语言响应
嵌入模型(Embedding Model)：负责将文档转换为向量表示

解决方案

1. 配置大语言模型

首先需要正确初始化并设置自定义的LLM。以DeepSeek为例：

from llama_index.llms.deepseek import DeepSeek
from llama_index.core import Settings

llm = DeepSeek(model="deepseek-chat", api_key="your_api_key")
Settings.llm = llm  # 设置为全局LLM

2. 配置嵌入模型

仅仅设置LLM是不够的，还必须配置嵌入模型。LlamaIndex提供了多种选择：

from llama_index.embeddings.huggingface import HuggingFaceEmbedding

# 使用HuggingFace的嵌入模型
Settings.embed_model = HuggingFaceEmbedding(
    model_name="BAAI/bge-small-en-v1.5"
)

3. 完整示例代码

结合上述配置，完整的文档索引和查询流程如下：

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
from llama_index.llms.deepseek import DeepSeek
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core import Settings

# 配置模型
llm = DeepSeek(model="deepseek-chat", api_key="your_api_key")
Settings.llm = llm
Settings.embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-small-en-v1.5")

# 加载文档并创建索引
documents = SimpleDirectoryReader("data").load_data()
index = VectorStoreIndex.from_documents(documents)

# 执行查询
query_engine = index.as_query_engine()
response = query_engine.query("查询问题")
print(response)