Spring Data Elasticsearch中@Query注解对复杂查询的支持限制分析

2025-06-27 14:34:28作者：何举烈Damon

Provide support to increase developer productivity in Java when using Elasticsearch. Uses familiar Spring concepts such as a template classes for core API usage and lightweight repository style data access.

项目地址：https://gitcode.com/gh_mirrors/sp/spring-data-elasticsearch

背景概述

在使用Spring Data Elasticsearch进行开发时，开发者经常会遇到需要使用@Query注解来构建复杂查询的场景。然而，近期有开发者反馈在使用@Query注解时遇到了一个典型问题：当尝试构建包含script_score和script_fields的复合查询时，script_fields部分无法正常工作。

问题现象

开发者尝试构建的查询包含两个主要部分：

script_score部分：用于计算文档的相关性得分，结合了两个向量的余弦相似度
script_fields部分：试图添加一个名为clubId的计算字段

然而实际执行时发现只有script_score部分被正确执行，script_fields部分被完全忽略。

技术分析

根本原因

问题的根本原因在于查询JSON的结构不正确。在Elasticsearch中，一个完整的查询DSL应该是一个完整的JSON对象，而开发者提供的查询实际上包含了两个独立的JSON对象（用逗号分隔），这在JSON语法上是无效的。

正确的查询结构

正确的做法应该是将script_fields作为script_score查询的同级元素，放在同一个JSON对象中。例如：

{
  "script_score": {
    "query": {
      "match_all": {}
    },
    "script": {
      "source": "cosineSimilarity(params.query_vector, 'nameVector') * 0.6 + cosineSimilarity(params.query_vector, 'descriptionVector') *0.4",
      "params": {
        "query_vector": ?0
      }
    }
  },
  "script_fields": {
    "clubId": {
      "script": {
        "source": "return false;"
      }
    }
  }
}

Spring Data Elasticsearch的实现机制

Spring Data Elasticsearch的@Query注解实际上是将提供的JSON字符串直接传递给Elasticsearch客户端执行。它不会对查询结构进行任何验证或修改，因此开发者必须确保提供的查询字符串是完整且语法正确的Elasticsearch查询DSL。

解决方案

方案一：修正JSON结构

最简单的解决方案是修正JSON结构，确保整个查询是一个完整的JSON对象：

@Query("""
        {
          "script_score": {
            "query": {
              "match_all": {}
            },
            "script": {
              "source": "cosineSimilarity(params.query_vector, 'nameVector') * 0.6 + cosineSimilarity(params.query_vector, 'descriptionVector') *0.4",
              "params": {
                "query_vector":?0
              }
            }
          },
          "script_fields": {
            "clubId": {
              "script": {
                "source": "return false;"
              }
            }
          }
        }
        """)

方案二：使用NativeSearchQueryBuilder

对于更复杂的查询场景，建议使用NativeSearchQueryBuilder以编程方式构建查询：

NativeSearchQuery query = new NativeSearchQueryBuilder()
    .withQuery(QueryBuilders.scriptScoreQuery(
        QueryBuilders.matchAllQuery(),
        new Script(ScriptType.INLINE, "painless",
            "cosineSimilarity(params.query_vector, 'nameVector') * 0.6 + cosineSimilarity(params.query_vector, 'descriptionVector') *0.4",
            Collections.singletonMap("query_vector", queryVector)))
    .withScriptField("clubId", new Script("return false;"))
    .build();