首页
/ CVAT项目v2.25.0版本发布:增强标注功能与质量评估优化

CVAT项目v2.25.0版本发布:增强标注功能与质量评估优化

2025-06-03 14:55:26作者:沈韬淼Beryl

CVAT(Computer Vision Annotation Tool)是一个开源的计算机视觉标注工具,广泛应用于机器学习数据标注领域。它提供了丰富的标注功能、格式支持和协作能力,是计算机视觉研究人员和工程师的重要工具。近日,CVAT发布了v2.25.0版本,带来了一系列功能增强和质量改进。

核心功能更新

原生函数命令行支持

本次更新在CLI(命令行界面)中新增了对原生函数的操作命令。这一改进使得开发者能够更高效地通过命令行管理CVAT中的函数资源,为自动化工作流提供了更好的支持。对于需要批量处理或集成CVAT到现有系统的用户来说,这一功能将显著提升工作效率。

Ultralytics YOLO格式增强

在数据标注格式支持方面,v2.25.0版本对Ultralytics YOLO格式进行了重要改进:

  1. 格式重命名:原先的"YOLOv8格式"现在统一更名为"Ultralytics YOLO格式",这反映了该格式对YOLO系列模型的通用支持,而不仅限于v8版本。

  2. 跟踪支持:新版本为Ultralytics YOLO格式添加了对目标跟踪(tracks)的支持。这意味着现在可以导出包含目标ID信息的标注数据,这对于视频分析等需要追踪目标随时间变化的场景尤为重要。

  3. 旋转框兼容性:修复了导出/导入过程中旋转框(rotated boxes)方向信息的问题,确保了标注数据的准确性。

  4. 数据集处理优化:解决了当同时存在训练集和默认数据集时的导出问题,提高了数据处理的可靠性。

质量评估改进

在标注质量评估方面,v2.25.0对空帧处理逻辑进行了重要调整:

  • match_empty_frames质量设置更名为empty_is_annotated
  • 新设置会将所有空帧纳入最终评估指标,而不仅仅是匹配的空帧
  • 这一改变使得精确度(Precision)等指标更具代表性和实用性

这一改进特别适用于那些需要评估标注完整性的场景,能够更全面地反映标注质量。

性能与稳定性提升

本次更新还包含了一些重要的稳定性修复:

  • 修复了删除帧时可能出现的问题,提高了数据管理的可靠性
  • 优化了YOLO格式处理逻辑,确保数据导出的稳定性

这些改进使得CVAT在处理大规模数据集时更加稳定可靠。

总结

CVAT v2.25.0版本通过增强命令行支持、改进YOLO格式兼容性和优化质量评估逻辑,进一步提升了这款开源标注工具的功能性和实用性。这些更新特别有利于需要进行大规模数据标注、目标跟踪任务或自动化工作流的用户。随着计算机视觉应用的不断发展,CVAT持续迭代的功能使其保持在行业前沿,为研究人员和工程师提供了强大的支持工具。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
23
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
225
2.27 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
flutter_flutterflutter_flutter
暂无简介
Dart
526
116
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
987
583
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
351
1.42 K
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
61
17
GLM-4.6GLM-4.6
GLM-4.6在GLM-4.5基础上全面升级:200K超长上下文窗口支持复杂任务,代码性能大幅提升,前端页面生成更优。推理能力增强且支持工具调用,智能体表现更出色,写作风格更贴合人类偏好。八项公开基准测试显示其全面超越GLM-4.5,比肩DeepSeek-V3.1-Terminus等国内外领先模型。【此简介由AI生成】
Jinja
47
0
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
17
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
JavaScript
212
287