Dinky项目中的Flink SQL CEP功能详解

2025-06-24 22:54:52作者：翟萌耘Ralph

Dinky is an out-of-the-box, one-stop, real-time computing platform dedicated to the construction and practice of Unified Streaming & Batch and Unified Data Lake & Data Warehouse. Based on Apache Flink, Dinky provides the ability to connect many big data frameworks including OLAP and Data Lake.

项目地址：https://gitcode.com/gh_mirrors/di/dinky

概述

Dinky作为一款基于Apache Flink的实时计算平台，完全支持Flink SQL的复杂事件处理(CEP)功能。本文将详细介绍如何在Dinky中正确使用Flink SQL CEP功能，帮助开发者避免常见错误并充分发挥CEP的强大能力。

Flink SQL CEP核心概念

Flink SQL CEP是基于MATCH_RECOGNIZE语法的模式匹配功能，它允许用户在数据流中识别特定的事件序列模式。这种功能在金融风控、异常检测、用户行为分析等场景中具有重要应用价值。

在Dinky中使用CEP的正确方法

基本语法结构

在Dinky中编写CEP SQL查询时，必须遵循以下基本结构：

SELECT [字段列表]
FROM [表名]
    MATCH_RECOGNIZE (
        [PARTITION BY 分区字段]
        ORDER BY [时间字段]
        MEASURES
            [定义输出字段]
        [ONE ROW PER MATCH | ALL ROWS PER MATCH]
        [AFTER MATCH策略]
        PATTERN ([模式定义])
        DEFINE
            [变量定义]
    ) [别名]

实际应用示例

以下是一个完整的CEP示例，展示了如何在Dinky中正确使用LAST、FIRST等CEP函数：

-- 创建模拟数据源表
CREATE TABLE Ticker (
    symbol STRING,
    price BIGINT,
    tax BIGINT,
    rowtime as proctime()
) WITH (
    'connector' = 'datagen',
    'rows-per-second'='5',
    'fields.symbol.kind'='random',
    'fields.symbol.length'='5',
    'fields.price.min'='100',
    'fields.price.max'='500',
    'fields.tax.min'='0',
    'fields.tax.max'='50'
);

-- CEP查询示例
SELECT *
FROM Ticker
    MATCH_RECOGNIZE (
        PARTITION BY symbol
        ORDER BY rowtime
        MEASURES
            START_ROW.rowtime AS start_tstamp,
            LAST(PRICE_DOWN.rowtime) AS bottom_tstamp,
            LAST(PRICE_UP.rowtime) AS end_tstamp
        ONE ROW PER MATCH
        AFTER MATCH SKIP TO LAST PRICE_UP
        PATTERN (START_ROW PRICE_DOWN+ PRICE_UP)
        DEFINE
            PRICE_DOWN AS
                (LAST(PRICE_DOWN.price, 1) IS NULL AND PRICE_DOWN.price < START_ROW.price) OR
                    PRICE_DOWN.price < LAST(PRICE_DOWN.price, 1),
            PRICE_UP AS
                PRICE_UP.price > LAST(PRICE_DOWN.price, 1)
    ) MR;