Apache Hudi在Flink中执行DELETE操作时的分区扫描优化实践

2025-06-05 13:22:49作者：沈韬淼Beryl

问题背景

在使用Apache Hudi与Flink集成时，开发人员发现了一个性能问题：当通过Flink批处理作业执行DELETE操作时，即使SQL语句中明确指定了分区条件，Hudi仍然会扫描所有分区数据。这种行为导致了不必要的资源消耗，特别是在处理大型表时，甚至可能引发作业超时问题。

技术分析

问题现象

在具体实践中，开发人员创建了一个Hudi表，并通过Flink SQL执行DELETE操作。表结构设计为按x字段分区，DELETE语句中明确指定了x='cl-278'的条件。然而，作业执行时却扫描了全表数据，而非仅扫描目标分区。

从Flink UI的作业DAG图中可以观察到，index_bootstrap操作符成为了性能瓶颈。该操作符处理的数据量与整个表的数据量相当，这与预期仅处理特定分区数据的期望不符。

根本原因

经过深入分析，发现问题根源在于索引配置的缺失。虽然数据摄入作业已经正确配置了桶索引(Bucket Index)，但DELETE作业中未指定索引类型，导致Hudi默认使用了不同的索引机制。

Hudi的索引引导(index_bootstrap)操作在以下情况下会被跳过：

当操作类型为OVERWRITE时
当使用桶索引(Bucket Index)时
对于非分区表

由于DELETE作业未明确配置索引类型，系统执行了全表扫描来构建索引，造成了性能问题。

解决方案

正确配置索引

为确保DELETE操作高效执行，需要为DELETE作业配置与摄入作业相同的索引类型。具体配置如下：

CREATE TABLE IF NOT EXISTS hudi_temp(
  x STRING,
  _date STRING,
  _count BIGINT,
  type STRING,
  update_date TIMESTAMP(3)
) PARTITIONED BY (`x`) 
WITH (
  'connector' = 'hudi',
  'hoodie.datasource.write.recordkey.field'='x,_date',
  'path' = '${bucket_path_daily}',
  'table.type' = 'COPY_ON_WRITE',
  'hoodie.datasource.write.precombine.field'='updated_date',
  'write.operation' = 'delete',
  'hoodie.datasource.write.partitionpath.field'='x',
  'hoodie.write.concurrency.mode'='optimistic_concurrency_control',
  'hoodie.write.lock.provider'='org.apache.hudi.client.transaction.lock.InProcessLockProvider',
  'hoodie.cleaner.policy.failed.writes'='LAZY',
  'hoodie.index.type'= 'BUCKET',
  'hoodie.index.bucket.engine' = 'SIMPLE',
  'hoodie.bucket.index.num.buckets'='16',
  'hoodie.bucket.index.hash.field'='x'
)