LangChain中OpenSearch向量检索的性能优化实践

2025-04-28 07:05:36作者：何举烈Damon

背景介绍

在使用LangChain框架集成OpenSearch进行向量检索时，开发者经常会遇到检索结果不符合预期的情况。本文通过一个实际案例，深入分析在大规模数据场景下如何优化OpenSearch的检索性能。

问题现象

开发者在LangChain 0.2.16版本中，使用OpenSearchVectorSearch进行文档检索时发现：

通过LangChain集成的检索无法返回预期结果
直接使用OpenSearch原生查询却能获得正确响应
错误提示显示"similarity_search() got multiple values for argument 'query'"

根本原因分析

经过深入排查，发现问题根源在于LangChain默认的检索参数配置：

两阶段检索机制缺陷：
- 默认配置先进行文件级别的KNN近似搜索
- 然后在结果集上进行文档级别的过滤
- 当数据量大时，第一阶段可能漏掉相关文档
参数传递冲突：
- 当尝试自定义script_score查询时
- 与框架内部query参数产生了冲突

优化方案

方案一：调整检索范围

# 修改search_kwargs配置
search_kwargs = {
    "size": num_of_chunks,
    "query": {
        "bool": {
            "should": [{
                "script_score": {
                    "query": {"match_all": {}},
                    "script": {
                        "source": "cosineSimilarity(params.query_vector, doc['vector_field']) + 1.0",
                        "params": {"query_vector": query_embedding},
                    }
                }
            }]
        }
    }
}

方案二：完善检索链配置

# 1. 创建自定义提示模板
prompt_template = PromptTemplate(
    input_variables=["context", "question"],
    template="使用以下文档回答问题:\n\n{context}\n\n问题: {question}\n\n回答:"
)

# 2. 构建文档处理链
combine_docs_chain = create_stuff_documents_chain(
    llm=llm, 
    prompt=prompt_template
)

# 3. 创建完整的检索链
retrieval_chain = create_retrieval_chain(
    retriever, 
    combine_docs_chain
)