CVAT项目v2.31.0版本发布：标注工具功能升级与优化

2025-06-03 07:51:31作者：柏廷章Berta

CVAT（Computer Vision Annotation Tool）是一个开源的计算机视觉标注工具，广泛应用于机器学习数据标注领域。它提供了丰富的标注功能，包括图像分类、目标检测、语义分割等任务的支持。CVAT以其高效性和灵活性在计算机视觉领域获得了广泛认可。

SDK功能增强：自动标注与属性处理

本次v2.31.0版本在SDK方面进行了重要升级。自动标注检测功能现在能够输出形状和关键点的属性信息，这为开发者提供了更丰富的标注数据输出能力。同时，新增的cvat_sdk.attributes工具模块专门用于处理标签属性，简化了属性相关操作。

对于使用CVAT SDK进行自动标注的开发人员来说，这些改进意味着可以更精细地控制标注输出。例如，在目标检测任务中，现在可以直接通过自动标注输出物体的颜色、状态等属性信息，而不需要额外的后处理步骤。

共识任务合并功能改进

在多人协作标注场景中，CVAT引入了共识任务合并的简单模式。这一功能特别适用于需要多个标注人员对同一数据进行标注，然后合并结果的场景。新版本中，骨架标注中的隐藏点现在也会参与相似度计算和共识合并过程，使得合并结果更加准确和全面。

这一改进对于3D姿态估计等需要骨架标注的任务尤为重要。隐藏点（如被遮挡的关节点）的参与计算，能够更真实地反映标注质量，提高合并结果的可靠性。

用户界面与显示优化

在用户体验方面，v2.31.0版本新增了显示矩形和椭圆尺寸及旋转角度的设置选项。这一功能使得标注人员在查看和编辑几何形状时能够获得更精确的视觉反馈，提高了标注的准确性。

同时，修复了图像过滤器应用时的标签缩放问题，以及简单GT（Ground Truth）任务中图像显示不正确的问题。这些修复提升了工具在复杂标注场景下的稳定性和可用性。

数据导入与处理改进

在数据导入方面，SDK的task.upload_data()方法现在支持Path类型的资源输入，当资源类型为REMOTE或SHARE时更加灵活。这一改进简化了远程数据导入的代码编写。

值得注意的是，新版本弃用了通过特定API端点检查导入状态的方式，转而修复了可能导致导入过程中出现竞争条件的问题。这些改动使得大规模数据导入更加可靠和高效。

技术实现细节

从技术实现角度看，本次版本修复了TUS OPTIONS请求可能返回500状态码的问题。TUS是一种基于HTTP的文件上传协议，CVAT使用它来处理大文件上传。这一修复提高了文件上传功能的稳定性。

在架构层面，新版本优化了标注导入过程中的状态检查机制，避免了潜在的竞态条件，这对于保证数据一致性非常重要。

总结

CVAT v2.31.0版本在自动标注、共识合并、用户界面和数据处理等多个方面进行了功能增强和问题修复。这些改进不仅提升了工具的实用性和稳定性，也为计算机视觉数据标注工作流带来了更高的效率。特别是对骨架标注和属性处理的支持增强，使得CVAT在复杂标注场景下的表现更加出色。

对于计算机视觉研究人员和标注团队来说，升级到这一版本将获得更流畅的标注体验和更可靠的数据处理能力。随着CVAT的持续发展，它正成为开源标注工具领域的重要选择之一。

cvat

Annotate better with CVAT, the industry-leading data engine for machine learning. Used and trusted by teams at any scale, for data of any scale.

项目地址：https://gitcode.com/GitHub_Trending/cvat/cvat

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理