GreptimeDB 中创建数据流时遇到的 SQL 语法问题分析

2025-06-10 19:10:28作者：晏闻田Solitary

问题背景

在使用 GreptimeDB 进行数据流(Flow)创建时，开发人员遇到了两个关键问题。第一个是 SQL 语法解析错误，第二个是数据类型不匹配问题。这些问题出现在使用 CREATE FLOW 语句从 ngx_access_log 表聚合数据到 ngx_statistics 表的过程中。

语法解析问题

最初的问题出现在 date_bin 函数中使用时间间隔(INTERVAL)的语法上。错误信息显示："INTERVAL requires a unit after the literal value"。这是由于 SQL 解析器对 MySQL 方言实施了严格的规则要求。

在 GreptimeDB 的 SQL 解析器实现中，对于时间间隔的语法要求必须使用 INTERVAL '1' MINUTE 这样的格式，而不是 INTERVAL '1 minutes'。这种严格性来源于底层使用的 sqlparser-rs 库的更新，该库在 5 个月前添加了这项检查。

数据类型不匹配问题

在解决了语法问题后，又遇到了数据类型不匹配的错误。错误信息指出："Column 5(name is 'high_size_count', flow inferred name is 'high_size_count')'s data type mismatch, expect Int64(Int64Type) got Float64(Float64Type)"。

这个问题源于 sum 函数中的 CASE 表达式使用了 ::double 类型转换，导致结果被推断为 Float64 类型，而目标表期望的是 Int64 类型。解决方案是移除不必要的类型转换，直接使用整数字面量。

解决方案

最终的解决方案需要对原始 SQL 进行两处修改：

修正 INTERVAL 语法，使用 INTERVAL '1' MINUTE 格式
移除 CASE 表达式中的 ::double 类型转换，直接使用整数比较和求和

修正后的 SQL 语句如下：

CREATE FLOW ngx_aggregation
SINK TO ngx_statistics
AS
SELECT
    status,
    count(client) AS total_logs,
    min(size) as min_size,
    max(size) as max_size,
    avg(size) as avg_size,
    sum(case when size > 550 then 1 else 0 end) as high_size_count,
    date_bin(INTERVAL '1' MINUTE, access_time) as time_window,
FROM ngx_access_log
GROUP BY
    status,
    time_window;