RisingWave分布式DML执行优化解析

2025-05-29 17:29:18作者：冯爽妲Honey

背景概述

RisingWave作为一款分布式流处理数据库，其DML(数据操作语言)执行性能直接影响着系统的整体吞吐量。在早期版本中，RisingWave采用了一种随机选择计算节点的方式来分发DML操作负载，这种方式能够有效平衡各计算节点的写入压力。然而，在后续的优化过程中，这种随机分发机制被移除，导致所有DML操作都被集中到单个计算节点上执行。

问题分析

当DML操作被集中到单个计算节点时，会带来两个主要问题：

性能瓶颈：该计算节点会成为整个集群的瓶颈，特别是在处理大规模数据写入时
资源利用不均衡：其他计算节点的计算能力无法被充分利用

虽然通过dml_rate_limit参数可以限制写入速率以避免节点过载，但这会以牺牲DML执行速度为代价，在某些对写入速度有要求的场景下并不理想。

解决方案

RisingWave提供了batch_enable_distributed_dml配置选项来解决这一问题。该选项启用后，系统会将DML操作分片并分发到所有计算节点上并行执行，而不是集中在单个节点。

技术实现细节

分布式执行机制：启用该选项后，DML操作会被拆分为多个chunk，并分发到所有计算节点的DMLExecutor上并行处理
数据重分布：在DMLExecutor处理完成后，数据会根据表的分发策略(如Hash分发)进行重新分布
执行计划变化：通过对比执行计划可以看到，启用分布式DML后，系统会添加额外的Exchange节点来实现数据的分发和重分布

性能考量

值得注意的是，虽然分布式DML理论上可以提高并行度，但在实际测试中性能提升可能并不显著。这是因为：

后续的数据重分布操作：数据在DMLExecutor处理后还需要根据表的分发策略进行重分布，这会带来额外的开销
网络传输成本：跨节点的数据传输会增加网络带宽消耗

适用场景

分布式DML特别适合以下场景：

大规模数据写入：当需要处理大量数据写入时，分布式执行可以避免单节点成为瓶颈
DELETE操作：即使是基于主键的DELETE操作，分布式DML仍然有效，因为数据会在DMLExecutor处理后根据分发策略正确重分布

总结

RisingWave通过batch_enable_distributed_dml配置选项提供了灵活的DML执行策略选择。用户可以根据实际业务场景和性能需求，权衡单节点执行和分布式执行的利弊，选择最适合的配置方式。对于需要处理大规模DML操作的场景，启用分布式DML可以有效提高系统吞吐量和资源利用率。

risingwave

Event streaming platform for agentic AI. Continuously ingest, transform, and serve event streams in real time, at scale.

项目地址：https://gitcode.com/gh_mirrors/ri/risingwave

登录后查看全文