Oban Web 仪表盘在大规模作业下的性能优化实践

2025-06-22 17:20:23作者：咎岭娴Homer

背景介绍

Oban 是一个基于 Elixir 语言的分布式作业处理系统，广泛应用于后台任务调度场景。随着业务规模的增长，部分用户可能会遇到 Oban Web 仪表盘在作业数量达到百万级别时出现查询性能问题的情况。本文将深入分析这一问题的根源，并提供多种有效的解决方案。

问题分析

当作业表(oban_jobs)中的记录数量超过500万条时，仪表盘中的作业页面加载会出现明显的延迟，甚至导致查询超时。通过分析执行计划发现，主要瓶颈在于对作业状态(state)和操作时间字段的查询缺乏有效的索引支持。

核心解决方案

针对性创建部分索引

PostgreSQL 的部分索引功能可以显著提升特定状态作业的查询效率。以下是针对不同作业状态的推荐索引方案：

-- 执行中状态的作业
CREATE INDEX oban_jobs_attempted_at ON oban_jobs (state, attempted_at) 
WHERE state = 'executing';

-- 已完成状态的作业
CREATE INDEX oban_jobs_completed_at ON oban_jobs (state, completed_at) 
WHERE state = 'completed';

-- 可用/可重试/已调度状态的作业
CREATE INDEX oban_jobs_scheduled_at ON oban_jobs (state, scheduled_at) 
WHERE state IN ('available', 'retryable', 'scheduled');

-- 已取消状态的作业
CREATE INDEX oban_jobs_cancelled_at ON oban_jobs (state, cancelled_at) 
WHERE state = 'cancelled';

-- 已丢弃状态的作业
CREATE INDEX oban_jobs_discarded_at ON oban_jobs (state, discarded_at) 
WHERE state = 'discarded';

这些索引针对每种作业状态和其对应的关键时间字段创建，能够显著提升仪表盘中的排序和筛选性能。

查询结果集限制

Oban 提供了回调函数机制，允许开发者控制每种状态下返回的作业数量上限：

def jobs_query_limit(_state), do: 250_000

这一设置可以有效防止查询返回过多的记录，建议根据实际业务需求调整具体数值。对于已完成作业较多的场景，特别建议设置合理的限制值。

实施建议

在创建新索引前，建议先对数据库执行VACUUM ANALYZE命令更新统计信息
索引创建后，重启应用以确保Ecto使用新的查询计划
根据实际业务场景调整查询限制值，平衡性能与数据可见性需求
定期监控查询性能，根据数据增长情况适时调整索引策略

总结

通过合理的索引设计和查询限制，可以显著提升Oban Web仪表盘在大规模作业环境下的性能表现。这些优化措施特别适合作业数量超过百万级别的生产环境，能够确保管理员仍然可以高效地监控作业执行情况。

oban

💎 Robust job processing in Elixir, backed by modern PostgreSQL, SQLite3, and MySQL

项目地址：https://gitcode.com/gh_mirrors/ob/oban

登录后查看全文