Agenta项目中的评估队列状态优化方案

2025-06-29 09:15:26作者：咎竹峻Karen

The open-source LLMOps platform: prompt playground, prompt management, LLM evaluation, and LLM observability all in one place.

项目地址：https://gitcode.com/gh_mirrors/ag/agenta

在AI应用开发平台Agenta的最新版本中，开发团队针对评估任务执行状态进行了重要优化。本文将详细介绍这项改进的技术背景、实现方案及其对用户体验的提升。

背景与问题分析

在分布式任务处理系统中，当所有工作线程都处于忙碌状态时，新提交的任务会进入等待队列。在Agenta平台原有的设计中，评估任务只有"运行中"和"已完成"两种状态，无法准确反映这种排队等待的情况。这导致用户在提交评估后，如果系统资源紧张，界面会一直显示"运行中"状态，而实际上任务可能尚未开始执行，造成用户困惑。

技术解决方案

开发团队通过引入"Queued"(排队中)状态解决了这一问题。具体实现包含以下技术要点：

状态机扩展：在评估任务的状态机中新增"Queued"状态，位于"Pending"和"Running"之间，形成完整的状态流转逻辑。
Celery集成：后端服务通过检查Celery任务队列，准确识别任务是否处于排队状态。Celery提供了丰富的API来查询任务状态，包括是否被worker接收、是否正在执行等。
前后端协同：前端界面根据新的状态值显示相应的提示信息，帮助用户理解评估任务的当前状况。

实现细节

在技术实现层面，主要涉及以下修改：

数据库模型更新：在评估任务表中扩展状态字段，允许存储"queued"值。
状态检查逻辑：后端服务定期轮询Celery，获取任务的真实执行状态，更新数据库记录。
前端展示优化：新增排队状态的视觉标识和说明文字，确保用户清晰了解任务进展。

用户体验提升

这项改进显著提升了平台的用户体验：

透明度提高：用户现在可以明确知道自己的评估任务是正在执行还是在等待资源。
预期管理：排队状态提示帮助用户建立合理的时间预期，减少因等待产生的焦虑。
资源感知：频繁出现排队状态可能提示用户系统资源不足，考虑升级配置或错峰使用。

技术挑战与解决方案

在实现过程中，开发团队面临并解决了以下挑战：

状态一致性：确保Celery任务状态与数据库记录同步，采用了定期同步和事件触发相结合的机制。
性能考量：状态检查需要平衡实时性和系统负载，通过合理的轮询间隔和批量处理优化性能。
异常处理：完善了各种边界情况的处理逻辑，如worker崩溃、网络中断等场景下的状态恢复。

这项改进虽然看似简单，但对提升平台的专业性和用户体验有着重要意义，体现了Agenta团队对细节的关注和对用户需求的快速响应能力。

The open-source LLMOps platform: prompt playground, prompt management, LLM evaluation, and LLM observability all in one place.

项目地址：https://gitcode.com/gh_mirrors/ag/agenta

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。