Manticore Search中使用命名选择器在WHERE子句中导致崩溃的问题分析

2025-05-23 02:02:53作者：温艾琴Wonderful

manticoresearch

manticoresoftware/manticoresearch: 这是一个用于快速搜索和索引数据的搜索引擎。适合用于需要快速搜索和索引数据的场景。特点：易于使用，支持多种数据格式，具有高性能和可扩展性。

项目地址：https://gitcode.com/gh_mirrors/ma/manticoresearch

问题概述

在Manticore Search数据库系统中，当用户尝试在WHERE子句中使用命名选择器（named select）时，系统会出现崩溃现象。这个问题主要出现在处理JSON数据类型和地理距离计算函数的组合查询场景中。

问题重现

该问题可以通过以下SQL查询序列重现：

首先创建一个包含JSON字段的表：

CREATE TABLE test(id bigint, coordinates json);

插入测试数据：

INSERT INTO test(id, coordinates) VALUES (1, '[{"latitude":47.425413,"longitude":9.612921,"ort":"9442"},{"latitude":47.425413,"longitude":9.612921,"ort":"9442"}]');

执行包含命名选择器的查询：

SELECT
    id, coordinates, 
    ANY(GEODIST(47.425413, 9.612921, x.latitude, x.longitude, {in=deg, out=km}) <= 5 FOR x IN coordinates) as coordinates_multi
FROM test
WHERE coordinates_multi = 1
GROUP BY id;

技术背景

Manticore Search是一个高性能的全文搜索引擎，支持SQL-like查询语法。在这个案例中，涉及到几个关键技术点：

JSON数据处理：Manticore支持JSON数据类型，可以存储和查询复杂的JSON结构。
地理距离计算：GEODIST函数用于计算两个地理坐标点之间的距离。
命名选择器：在SELECT子句中定义的别名可以在WHERE子句中引用。

问题根源分析

根据崩溃日志分析，问题出现在查询解析阶段，具体是在QueueCreator_c::SelectExprEvalStage方法中。系统在处理WHERE子句中的命名选择器时，未能正确识别和解析该表达式，导致内存访问越界或空指针引用。

核心问题在于：

查询优化器在处理WHERE条件时，没有正确识别命名选择器作为已计算的表达式
系统试图将命名选择器当作普通列处理，而实际上它需要特殊的表达式求值处理

解决方案

开发团队已经修复了这个问题，主要修改包括：

完善了表达式解析逻辑，确保能够正确识别命名选择器
增加了对WHERE子句中命名选择器的特殊处理路径
强化了错误处理机制，避免类似情况导致系统崩溃

最佳实践建议

在使用Manticore Search时，对于包含复杂表达式和命名选择器的查询，建议：

尽量避免在WHERE子句中直接引用SELECT子句定义的别名
对于必须使用的情况，可以先使用子查询或临时表
保持Manticore Search版本更新，及时获取最新的bug修复

总结

这个问题展示了数据库系统中查询解析和优化的复杂性，特别是在处理表达式别名和复杂数据类型时。Manticore Search团队快速响应并修复了这个问题，体现了开源社区对产品质量的重视。用户在使用高级查询功能时，应当注意查询结构的合理性，并在遇到问题时及时报告。

manticoresearch

manticoresoftware/manticoresearch: 这是一个用于快速搜索和索引数据的搜索引擎。适合用于需要快速搜索和索引数据的场景。特点：易于使用，支持多种数据格式，具有高性能和可扩展性。

项目地址：https://gitcode.com/gh_mirrors/ma/manticoresearch

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理