MapD/MapD-Core项目中GPU逻辑Bug分析：SELECT查询结果不一致问题

2025-06-27 21:33:30作者：毕习沙Eudora

问题背景

在MapD/MapD-Core数据库系统(现称HeavyDB)中，用户发现了一个关于查询结果一致性的重要问题。当使用特定语法结构的SELECT查询时，CPU和GPU两种执行模式下会返回不同的结果集，这严重影响了系统的可靠性和一致性。

该问题可以通过以下步骤复现：

CREATE TABLE t0(c0 FLOAT);
INSERT INTO t0(c0) VALUES(0.1);

ALTER SESSION SET EXECUTOR_DEVICE='CPU';
SELECT /*+ keep_result */ * FROM t0 LIMIT 1 OFFSET 1;

此时返回空结果集，符合预期(因为表中只有一条记录，OFFSET 1应该跳过它)。

ALTER SESSION SET EXECUTOR_DEVICE='GPU';
SELECT /*+ keep_result */ * FROM t0 LIMIT 1 OFFSET 1;

此时却返回了0.1这条记录，与CPU模式结果不一致。

这个问题的核心在于GPU和CPU执行路径对于LIMIT/OFFSET子句的处理逻辑存在差异。具体表现为：

查询提示影响：问题查询中使用了/*+ keep_result */提示，这个提示原本用于保留中间结果，可能在GPU执行路径中影响了分页逻辑。
分页处理差异：GPU执行引擎在处理OFFSET时可能没有正确跳过指定行数，导致返回了本应被跳过的记录。
浮点数精度：虽然这不是主要问题，但注意到返回的浮点数0.1在GPU模式下显示为0.10000000149011612，这也暗示了GPU和CPU在数值处理上的潜在差异。

这种不一致性会对以下场景产生严重影响：

根据后续验证，该问题已在HeavyDB v8.0.2版本中得到修复。对于仍在使用受影响版本的用户，建议：

这个案例提醒我们：

数据库系统的查询执行一致性是基础要求，开发团队需要确保所有执行路径都遵循相同的语义规则，特别是在支持异构计算的系统中。这个问题的修复体现了开源社区对系统稳定性的持续改进。

登录后查看全文