Supabase Realtime 中 Janitor 进程延迟导致的开发环境问题分析

2025-05-30 01:14:43作者：卓炯娓

问题背景

在 Supabase Realtime 模块的开发环境中，存在一个容易被忽视但影响较大的问题：Janitor 进程的初始延迟可能导致消息存储功能在数据库重置后出现静默失败。这个问题特别影响开发工作流，尤其是那些需要频繁重置数据库的开发场景。

技术细节解析

Janitor 是 Supabase Realtime 中的一个后台进程，主要负责维护 realtime.messages 表的分区管理。默认配置下，Janitor 在启动后有 10 分钟的延迟（janitor_run_after_in_ms: 600000）才会开始执行分区创建任务。

在实现机制上，realtime.send() 函数依赖于预先存在的表分区来存储消息数据。当这些分区不存在时，函数调用虽然表面上成功，但实际上消息并未被持久化存储，形成了静默失败。

典型问题场景

全新安装或首次启动：当开发者首次设置本地 Supabase 环境后立即尝试使用 realtime.send() 时，由于 Janitor 尚未运行，分区未被创建，导致消息存储失败。
数据库重置后：执行 supabase db reset 命令会清除现有分区，而 Janitor 的延迟运行会导致分区重建不及时，在此期间的消息存储功能会受到影响。
自动化测试场景：在使用 pgTAP 等测试框架时，测试用例可能在数据库重置后立即验证消息功能，此时会遇到同样的问题。

解决方案演进

Supabase 团队已经意识到这个问题，并在后续版本中进行了改进：

环境初始化优化：在种子过程中确保执行必要的迁移和初始分区创建，解决了大部分首次启动场景下的问题。
连接时检查机制：当 Realtime 连接到数据库时，会主动检查迁移状态和分区情况，确保必要的分区已经存在。
开发环境特殊处理：针对开发环境特点，考虑缩短 Janitor 的初始延迟或使其在启动时立即执行一次分区检查。

开发者应对策略

对于使用较旧版本或遇到类似问题的开发者，可以采用以下临时解决方案：

-- 手动创建当日分区的示例代码
DO $$
DECLARE
  today date := current_date;
  partition_name text := 'messages_' || to_char(today, 'YYYY_MM_DD');
BEGIN
  EXECUTE format(
    'CREATE TABLE IF NOT EXISTS realtime.%I PARTITION OF realtime.messages FOR VALUES FROM (%L) TO (%L)',
    partition_name,
    today,
    today + interval '1 day'
  );
END;
$$;