使用CVAT API获取带标注的帧数据

2025-05-16 13:33:08作者：舒璇辛Bertina

CVAT作为一款开源的计算机视觉标注工具，提供了丰富的API接口来与系统进行交互。本文将详细介绍如何通过CVAT API获取特定任务或作业中带有标注信息的帧数据。

获取标注数据的三种方式

CVAT提供了多种方式来获取标注数据，开发者可以根据实际需求选择最适合的方法：

1. 直接下载并解析标注

通过SDK可以直接获取标注对象，并访问其属性：

annotations = task.get_annotations()
print(annotations.shapes[0].to_dict())

这种方式会返回一个结构化的标注对象，包含形状(shape)、标签(tag)等属性，方便程序化处理。

2. 获取原始JSON数据

如果需要原始标注数据，可以直接获取JSON格式的响应：

(_, response) = task.api.retrieve_annotations(task.id, _parse_response=False)
print(json.loads(response.data))

这种方法适合需要完全控制数据处理流程的场景。

3. 导出完整数据集

CVAT支持将标注数据与图像一起导出为多种格式：

task.export_dataset(
    format_name="CVAT for images 1.1",
    filename=f"task-{task.id}-export.zip",
    include_images=True,
)

处理作业(Job)级别的标注

上述示例针对的是任务(Task)级别的操作，对于作业(Job)级别的操作也非常类似，只需将client.tasks替换为client.jobs即可：

job = client.jobs.retrieve(job_id)
annotations = job.get_annotations()

高级应用：筛选带标注的帧

在实际应用中，我们可能需要只处理包含标注的帧。以下是一个示例代码，展示如何识别并删除无标注的帧：

frames_with_annotations = set()

# 收集所有带标注的帧号
for tag in annotations.tags:
    frames_with_annotations.add(tag.frame)

for shape in annotations.shapes:
    frames_with_annotations.add(shape.frame)

# 计算需要删除的帧(无标注的帧)
meta = task.get_meta()
frame_step = int(meta.frame_filter.split("=")[-1]) if meta.frame_filter else 1
frames_to_remove = list(
    set(range(meta.start_frame, meta.stop_frame + 1, frame_step))
    - frames_with_annotations
)

# 执行删除操作
task.remove_frames_by_ids(frames_to_remove)