Supersonic项目中的语义层执行优化：跳过重复翻译阶段

2025-06-22 16:46:41作者：董斯意

在Supersonic项目的Headless模式实现中，我们发现了一个可以显著提升查询性能的优化点。当前系统在处理Chat调用时，会先执行解析阶段(performParsing)，然后再执行执行阶段(performExecution)。然而，在解析阶段系统已经通过SemanticTranslator获取了最终可执行的SQL语句，这种情况下执行阶段再次进行翻译就显得多余了。

现有流程分析

现有流程中，Headless模式处理查询请求时遵循以下步骤：

解析阶段(performParsing)：系统接收请求后，首先进行语法解析和语义分析，在这个过程中已经通过SemanticTranslator将高级查询转换为可直接执行的SQL语句。
执行阶段(performExecution)：尽管解析阶段已经生成了可执行SQL，系统仍会再次调用SemanticTranslator进行翻译，然后才执行查询。

这种设计导致了不必要的性能开销，特别是在高并发场景下，重复的翻译操作会显著增加系统负载和响应时间。

优化方案设计

针对这一问题，我们提出了以下优化方案：

结果缓存机制：在解析阶段生成的最终SQL应该被缓存起来，在执行阶段直接复用。
条件判断逻辑：SemanticLayerService在执行queryByReq方法时，应当首先检查输入中是否已经包含可执行SQL。如果存在，则跳过SemanticTranslator的调用流程。
状态传递优化：确保解析阶段生成的SQL能够完整传递到执行阶段，避免信息丢失。

实现细节

具体实现上，我们需要：

在解析阶段结束时，将生成的SQL语句存储在请求上下文中。

修改SemanticLayerService的queryByReq方法，增加前置检查逻辑：

if (request.containsExecutableSql()) {
    return executeDirectly(request.getSql());
}

确保所有相关的数据结构和接口都支持这种优化路径，保持向后兼容性。

预期收益

这项优化将带来以下好处：

性能提升：减少一次完整的翻译过程，显著降低查询延迟。
资源节约：降低CPU使用率，特别是在高负载情况下效果更为明显。
架构简化：使数据处理流程更加直观和高效。

注意事项

在实施这项优化时，需要考虑以下方面：

缓存一致性：确保缓存的SQL与最新数据模型保持同步。
错误处理：当直接执行缓存的SQL失败时，应有回退机制。
内存管理：对于大型查询，需要注意缓存SQL的内存占用。

这项优化已经在Supersonic项目中得到实现，通过减少不必要的计算步骤，显著提升了系统的整体性能表现。

supersonic

SuperSonic is the next-generation AI+BI platform that unifies Chat BI (powered by LLM) and Headless BI (powered by semantic layer) paradigms.

项目地址：https://gitcode.com/GitHub_Trending/su/supersonic

登录后查看全文