首页
/ CVAT项目v2.31.0版本发布:标注工具功能全面升级

CVAT项目v2.31.0版本发布:标注工具功能全面升级

2025-06-03 12:38:01作者:龚格成

项目简介

CVAT(Computer Vision Annotation Tool)是一个开源的计算机视觉标注工具,广泛应用于图像和视频数据的标注工作。作为计算机视觉领域的重要基础设施,CVAT为机器学习模型的训练提供了高质量的数据标注支持。本次发布的v2.31.0版本带来了多项功能增强和问题修复,进一步提升了标注效率和用户体验。

核心功能更新

SDK功能增强

本次版本在SDK方面进行了显著改进,特别是在自动标注检测功能方面:

  1. 属性输出支持:自动标注检测功能现在能够输出形状和关键点的属性信息,这为更复杂的标注场景提供了支持。开发者可以更灵活地处理标注数据,特别是在需要附加属性信息的场景下。

  2. 属性处理工具:新增了cvat_sdk.attributes工具模块,专门用于处理标签属性。这个模块的加入使得属性操作更加便捷和规范化,开发者可以更高效地管理和操作标注属性。

  3. 资源路径处理优化task.upload_data()方法现在能够接受Path类型的资源路径,无论是远程资源还是共享资源。这一改进使得文件路径处理更加灵活,减少了开发者在处理不同来源数据时的转换工作。

标注功能改进

  1. 共识任务合并:引入了简单的共识任务合并功能。这项改进特别适用于多人协作标注的场景,能够自动合并不同标注者的工作成果,提高团队协作效率。

  2. 骨架标注增强:在质量计算和共识合并过程中,现在会考虑骨架中被隐藏的点。这一变化使得骨架标注的相似度计算更加准确,提高了标注质量评估的可靠性。

  3. 形状信息显示:新增了显示矩形和椭圆尺寸及旋转角度的设置选项。标注者可以更直观地查看和调整这些几何形状的参数,提升了标注精度和用户体验。

问题修复与优化

本次版本修复了多个影响用户体验的问题:

  1. API稳定性:修复了支持TUS OPTIONS请求的API端点可能返回500状态码的问题,提高了API的稳定性和可靠性。

  2. 标注导入优化:解决了标注导入过程中可能出现的竞态条件问题,确保大规模标注数据导入的稳定性。

  3. 图像显示问题:修复了应用图像过滤器时标签缩放不正确的问题,以及简单GT任务中图像显示异常的问题,提升了视觉一致性。

  4. 相关图像显示:修正了简单GT任务中相关图像显示不正确的问题,确保了标注环境的准确性。

技术前瞻

从本次更新可以看出,CVAT项目正在向以下几个方向发展:

  1. 自动化程度提升:通过增强自动标注功能,减少人工标注工作量。

  2. 协作功能强化:共识合并功能的引入表明项目越来越重视团队协作场景。

  3. 开发者体验优化:SDK的持续改进反映了项目对开发者友好性的重视。

  4. 标注精度提高:新增的形状信息显示功能有助于提升标注质量。

这些改进方向与当前计算机视觉领域对高质量标注数据的需求高度契合,预示着CVAT将在AI数据准备环节发挥更重要的作用。

总结

CVAT v2.31.0版本通过多项功能增强和问题修复,进一步巩固了其作为开源计算机视觉标注工具的领导地位。无论是对于个人开发者还是企业团队,这些改进都将显著提升标注效率和体验。特别是自动标注功能的增强和共识合并的引入,为大规模标注项目提供了更好的支持。随着计算机视觉应用的不断普及,CVAT这样的工具将在AI模型开发流程中扮演越来越关键的角色。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
176
262
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
863
511
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
259
300
kernelkernel
deepin linux kernel
C
22
5
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
596
57
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
371
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
332
1.08 K