Spring Data Elasticsearch 中实现复杂查询（向量查询）的技术解析

2025-06-27 03:32:47作者：郦嵘贵Just

Provide support to increase developer productivity in Java when using Elasticsearch. Uses familiar Spring concepts such as a template classes for core API usage and lightweight repository style data access.

项目地址：https://gitcode.com/gh_mirrors/sp/spring-data-elasticsearch

在基于 Spring Data Elasticsearch 进行开发时，我们经常需要处理各种复杂的查询场景。本文将深入探讨如何正确实现向量查询这类高级查询功能，并分析常见的错误模式。

查询语法结构问题分析

从问题描述中可以看到，开发者尝试在 @Query 注解中使用完整的 Elasticsearch 查询 DSL 结构时遇到了语法错误。关键点在于：

错误的查询结构：

{
  "query": {
    "script_score": {...}
  }
}

这种结构会导致 Elasticsearch 解析异常，因为 @Query 注解的内容本身就会被作为 query 参数传递给 Elasticsearch。

正确的查询结构：

{
  "script_score": {
    "query": {...},
    "script": {...}
  }
}

这种写法能够被正确解析，因为它直接提供了 Elasticsearch 期望的查询体。

关于 NaN 评分问题的深入分析

当使用脚本评分时，可能会遇到返回的 _score 为 NaN 的情况，这通常由以下原因导致：

向量数据问题：检查文档中的向量字段是否存在且格式正确
脚本计算问题：确保 cosineSimilarity 计算不会产生数学异常
字段映射问题：确认向量字段被正确映射为 dense_vector 类型

最佳实践建议

查询构建方式：

对于简单查询，使用 @Query 注解
对于复杂查询，考虑使用 NativeSearchQueryBuilder 构建查询
对于需要排序的场景，可以通过方法参数传入 Sort 对象

向量查询优化：

public interface ClubRepository extends ReactiveElasticsearchRepository<ClubPO, String> {
    @Query("""
    {
      "script_score": {
        "query": {"match_all": {}},
        "script": {
          "source": "cosineSimilarity(params.vector, 'nameVector') + cosineSimilarity(params.vector, 'descriptionVector')",
          "params": {"vector": ?0}
        }
      }
    }
    """)
    Flux<SearchHit<ClubPO>> queryClubs(List<Double> vector, Sort sort);
}

调试技巧：

先在 Kibana Dev Tools 中测试查询语法
使用 Spring Data Elasticsearch 的日志功能查看最终发送的查询
检查字段映射确保与查询预期一致

高级查询方案

对于更复杂的查询场景，推荐使用 ElasticsearchOperations 或 ReactiveElasticsearchOperations：

@Service
public class ClubSearchService {
    
    private final ReactiveElasticsearchOperations operations;
    
    public Flux<ClubPO> searchByVector(List<Double> vector) {
        NativeSearchQuery query = new NativeSearchQueryBuilder()
            .withQuery(QueryBuilders.scriptScoreQuery(
                QueryBuilders.matchAllQuery(),
                new Script(ScriptType.INLINE, "painless",
                    "cosineSimilarity(params.vector, 'nameVector')", 
                    Collections.singletonMap("vector", vector))
            ))
            .build();
        
        return operations.search(query, ClubPO.class)
            .map(SearchHit::getContent);
    }
}