LlamaIndex项目中使用本地嵌入模型替代OpenAI的实践指南

2025-05-02 05:05:33作者：韦蓉瑛

背景介绍

LlamaIndex是一个流行的开源项目，用于构建和查询文档索引。在默认配置下，该项目使用OpenAI的API作为嵌入模型和语言模型的核心组件。然而，这种默认配置可能会给开发者带来一些困惑，特别是当开发者期望完全在本地运行而不依赖外部API服务时。

默认配置的问题

许多开发者初次使用LlamaIndex时，会遇到一个常见问题：即使只是调用基本的索引构建函数VectorStoreIndex.from_documents()，系统也会要求提供OpenAI的API密钥。这是因为LlamaIndex在默认情况下配置了以下组件：

嵌入模型：默认使用OpenAI的text-embedding-ada-002模型
语言模型：默认也使用OpenAI的GPT系列模型

这种设计主要是出于历史兼容性和易用性考虑，但对于希望完全本地运行的开发者来说，这种隐式依赖可能会造成困扰。

解决方案

LlamaIndex提供了灵活的配置选项，允许开发者轻松替换默认的OpenAI组件为本地运行的替代方案。

方法一：全局配置替换

开发者可以通过修改全局设置来替换默认模型：

from llama_index.core import Settings
from llama_index.embeddings.huggingface import HuggingFaceEmbedding

# 设置全局嵌入模型
Settings.embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-small-en-v1.5")

# 设置全局语言模型
# Settings.llm = ... (可配置本地LLM)

这种配置方式会影响到项目中所有后续操作，是最彻底的解决方案。

方法二：局部配置替换

如果只需要在特定场景下使用本地模型，可以在调用具体方法时传入自定义模型：

from llama_index.embeddings.huggingface import HuggingFaceEmbedding

embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-small-en-v1.5")
index = VectorStoreIndex.from_documents(documents, embed_model=embed_model)

这种方式更加灵活，适合需要混合使用不同模型的场景。