Oban项目中的高CPU使用率与分区表问题分析

2025-06-22 01:47:51作者：凌朦慧Richard

问题背景

在使用Oban Pro的DynamicPartitioner插件进行表分区后，系统出现了高CPU使用率的问题。具体表现为：

系统运行24小时后CPU使用率显著升高
大量作业卡在"available"状态无法正常执行
伴随出现序列化失败的错误日志

环境配置

Oban版本：2.17.3
Oban Pro版本：1.3.3
PostgreSQL版本：14.7（AWS RDS实例类型：db.m6g.2xlarge）
Elixir版本：1.15.6-otp-25
Erlang版本：25.3.2.6

问题现象分析

CPU使用率异常

监控数据显示，系统在启用表分区功能后，CPU使用率明显高于未分区时的水平。这种异常通常表明数据库查询效率下降或存在锁竞争问题。

作业状态异常

数据库查询显示大量作业卡在"available"状态：

state   | count
--------+-------
available | 4709

错误日志

系统日志中出现如下错误：

ERROR 40001 (serialization_failure) tuple to be locked was already moved to another partition due to concurrent update

根本原因

经过深入分析，发现问题主要由以下几个因素导致：

分区表锁定机制：PostgreSQL在处理分区表时，锁定机制与普通表不同，可能导致并发更新时的序列化失败。
DynamicLifeline插件兼容性：该插件在尝试救援孤儿作业时，未能正确处理分区表的特殊情况。
确认(ack)操作丢失：当数据库更新失败时，确认操作可能丢失，导致作业状态不一致。

解决方案

Oban团队在后续版本中发布了修复：

Oban Pro v1.3.4：包含了对分区表的多项性能优化和修复。
Oban Pro v1.3.5：专门解决了作业卡住的问题，改进了确认操作的处理机制。
Oban v2.17.4：基础版本也进行了相应更新以支持这些改进。

最佳实践建议

对于使用Oban分区功能的用户，建议：

及时升级：确保使用最新版本的Oban和Oban Pro。
监控作业状态：定期检查作业状态分布，特别是"available"和"executing"状态的作业数量。
合理设置保留策略：根据业务需求调整completed、cancelled和discarded状态的保留时间。
考虑自定义回收机制：对于关键业务，可以开发额外的作业监控和回收机制作为补充保障。

总结

表分区是处理大规模作业队列的有效手段，但需要特别注意PostgreSQL分区表的特殊行为和Oban插件的兼容性。通过版本升级和合理配置，可以有效解决高CPU使用率和作业卡住的问题，确保系统稳定运行。

oban

💎 Robust job processing in Elixir, backed by modern PostgreSQL or SQLite3

项目地址：https://gitcode.com/gh_mirrors/ob/oban

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理