CVAT v2.35.0版本发布：优化标注导入导出与内存管理

2025-06-03 22:10:27作者：魏献源Searcher

项目简介

CVAT（Computer Vision Annotation Tool）是一个开源的计算机视觉标注工具，广泛应用于图像和视频的标注任务。作为一款功能强大的标注平台，CVAT支持多种标注类型和格式，并提供自动化标注功能，是计算机视觉领域研究人员和工程师的重要工具。

在v2.35.0版本中，CVAT引入了对YOLO和COCO格式的流式导入支持。这一改进显著提升了大规模数据集导入时的性能表现。传统导入方式需要将整个标注文件加载到内存中，而流式导入则采用按需读取的方式，有效降低了内存占用，特别适合处理包含大量标注数据的项目。

YOLO和COCO是计算机视觉领域两种广泛使用的标注格式。YOLO格式以其简洁性著称，每个标注对象用一行文本表示，包含类别和边界框信息；而COCO格式则更为全面，采用JSON结构存储丰富的标注信息。CVAT对这两种格式的流式导入支持，使得用户能够更高效地处理大规模数据集。

本次版本在标注导出方面也进行了多项优化：

内存消耗降低：改进了CVAT格式的标注导出过程，通过优化内存管理策略，减少了导出过程中的内存占用。这对于处理大型项目或资源受限的环境尤为重要。
RLE转换加速：针对需要将CVAT RLE（Run-Length Encoding）格式转换为COCO RLE格式的导出任务，优化了转换算法，显著提升了处理速度。RLE是一种常用的图像压缩和表示方法，在实例分割任务中尤为重要。

这些优化使得CVAT在处理大规模标注数据时更加高效，为用户节省了宝贵的时间和系统资源。

v2.35.0版本对自动化标注功能进行了多项改进：

统一API响应格式：当调用检测器类型的Lambda函数时，POST请求的响应格式现在与GET标注端点保持一致。这种一致性改进使得API更易于使用和理解，简化了开发者的集成工作。
数值属性验证增强：
- 在全任务自动标注场景下，现在会严格检查Nuclio函数返回的数值属性值是否在可接受范围内，防止无效数据进入系统。
- 修复了按帧自动标注时，当最小值不是步长倍数时的数值范围验证问题，确保了验证逻辑的准确性。

这些改进提高了自动化标注的可靠性和数据质量，减少了后续人工检查的工作量。