首页
/ CVAT项目v2.31.0版本发布:标注工具功能全面升级

CVAT项目v2.31.0版本发布:标注工具功能全面升级

2025-06-03 20:50:40作者:龚格成

项目简介

CVAT(Computer Vision Annotation Tool)是一个开源的计算机视觉标注工具,广泛应用于图像和视频数据的标注工作。作为计算机视觉领域的重要基础设施,CVAT为机器学习模型的训练提供了高质量的数据标注支持。本次发布的v2.31.0版本带来了多项功能增强和问题修复,进一步提升了标注效率和用户体验。

核心功能更新

SDK功能增强

本次版本在SDK方面进行了显著改进,特别是在自动标注检测功能方面:

  1. 属性输出支持:自动标注检测功能现在能够输出形状和关键点的属性信息,这为更复杂的标注场景提供了支持。开发者可以更灵活地处理标注数据,特别是在需要附加属性信息的场景下。

  2. 属性处理工具:新增了cvat_sdk.attributes工具模块,专门用于处理标签属性。这个模块的加入使得属性操作更加便捷和规范化,开发者可以更高效地管理和操作标注属性。

  3. 资源路径处理优化task.upload_data()方法现在能够接受Path类型的资源路径,无论是远程资源还是共享资源。这一改进使得文件路径处理更加灵活,减少了开发者在处理不同来源数据时的转换工作。

标注功能改进

  1. 共识任务合并:引入了简单的共识任务合并功能。这项改进特别适用于多人协作标注的场景,能够自动合并不同标注者的工作成果,提高团队协作效率。

  2. 骨架标注增强:在质量计算和共识合并过程中,现在会考虑骨架中被隐藏的点。这一变化使得骨架标注的相似度计算更加准确,提高了标注质量评估的可靠性。

  3. 形状信息显示:新增了显示矩形和椭圆尺寸及旋转角度的设置选项。标注者可以更直观地查看和调整这些几何形状的参数,提升了标注精度和用户体验。

问题修复与优化

本次版本修复了多个影响用户体验的问题:

  1. API稳定性:修复了支持TUS OPTIONS请求的API端点可能返回500状态码的问题,提高了API的稳定性和可靠性。

  2. 标注导入优化:解决了标注导入过程中可能出现的竞态条件问题,确保大规模标注数据导入的稳定性。

  3. 图像显示问题:修复了应用图像过滤器时标签缩放不正确的问题,以及简单GT任务中图像显示异常的问题,提升了视觉一致性。

  4. 相关图像显示:修正了简单GT任务中相关图像显示不正确的问题,确保了标注环境的准确性。

技术前瞻

从本次更新可以看出,CVAT项目正在向以下几个方向发展:

  1. 自动化程度提升:通过增强自动标注功能,减少人工标注工作量。

  2. 协作功能强化:共识合并功能的引入表明项目越来越重视团队协作场景。

  3. 开发者体验优化:SDK的持续改进反映了项目对开发者友好性的重视。

  4. 标注精度提高:新增的形状信息显示功能有助于提升标注质量。

这些改进方向与当前计算机视觉领域对高质量标注数据的需求高度契合,预示着CVAT将在AI数据准备环节发挥更重要的作用。

总结

CVAT v2.31.0版本通过多项功能增强和问题修复,进一步巩固了其作为开源计算机视觉标注工具的领导地位。无论是对于个人开发者还是企业团队,这些改进都将显著提升标注效率和体验。特别是自动标注功能的增强和共识合并的引入,为大规模标注项目提供了更好的支持。随着计算机视觉应用的不断普及,CVAT这样的工具将在AI模型开发流程中扮演越来越关键的角色。

登录后查看全文
热门项目推荐
相关项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
144
1.92 K
kernelkernel
deepin linux kernel
C
22
6
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
192
274
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
930
553
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
422
392
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
145
189
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Jupyter Notebook
75
65
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
344
1.3 K
easy-eseasy-es
Elasticsearch 国内Top1 elasticsearch搜索引擎框架es ORM框架,索引全自动智能托管,如丝般顺滑,与Mybatis-plus一致的API,屏蔽语言差异,开发者只需要会MySQL语法即可完成对Es的相关操作,零额外学习成本.底层采用RestHighLevelClient,兼具低码,易用,易拓展等特性,支持es独有的高亮,权重,分词,Geo,嵌套,父子类型等功能...
Java
36
8