使用Sloth进行图像标注的入门指南

2025-06-11 12:16:12作者：卓炯娓

前言

Sloth是一个灵活的图像标注工具，特别适合计算机视觉和机器学习领域的研究人员和开发者使用。本文将详细介绍如何开始使用Sloth进行基本的图像标注工作，包括加载标签文件、编辑标注以及创建自定义配置。

快速开始

使用默认配置启动

最简单的使用方式是直接加载一个符合Sloth支持格式的标签文件：

sloth examples/example1_labels.json

这个示例文件包含了两个图像的标注信息：

image1.jpg：包含两个矩形标注
image2.jpg：包含一个点标注

标签文件采用JSON格式，结构清晰易懂。每个图像对象包含class、filename和annotations三个主要字段，其中annotations数组包含了该图像的所有标注。

标注编辑操作指南

选择标注

在Sloth中编辑标注前，首先需要选择目标标注：

鼠标选择：直接点击标注区域
键盘选择：使用TAB键循环切换当前图像中的所有标注

被选中的标注会显示为虚线轮廓，便于识别。

修改标注位置

鼠标操作：

左键拖动：移动标注位置
右键拖动（矩形标注）：调整宽度和高度

键盘操作：

方向键：以1像素为步长移动标注
Shift+方向键：以5像素为步长移动标注
Ctrl+方向键（矩形标注）：调整宽度和高度
Ctrl+Shift+方向键：以5像素为步长调整矩形尺寸

添加新标注

Sloth提供了直观的标注添加方式：

在属性面板（默认位于窗口左侧）点击对应标注类型的按钮
进入插入模式后，直接在图像上绘制新标注

快捷键：

r：进入矩形标注插入模式
p：进入点标注插入模式

自定义配置详解

Sloth的强大之处在于其高度可定制的配置系统。通过创建Python格式的配置文件，用户可以完全自定义标注类型、属性和交互方式。

基本配置结构

配置文件的核心是LABELS变量，它是一个包含多个字典的元组/列表，每个字典定义一种标注类型：

LABELS = (
    {
        "attributes": {"type": "rect", "class": "head", "id": ["Martin", "Mika"]},
        "item": "sloth.items.RectItem",
        "inserter": "sloth.items.RectItemInserter",
        "text": "Head"
    },
    # 更多标注类型...
)

配置项解析

text：标注类型的描述文本，显示在属性面板中
item：指定用于可视化标注的类
- sloth.items.RectItem：矩形标注
- sloth.items.PointItem：点标注
inserter：指定用于创建新标注的插入器类
attributes：定义标注属性和编辑方式
- 固定键值对：自动添加到新标注中且不可编辑
- 值列表：用户可从下拉列表中选择，支持交互式编辑

属性匹配机制

Sloth使用class和type两个键进行标注类型匹配：

两者都匹配时优先
只有一个匹配且另一个不存在时也会匹配
按LABELS中的顺序检查，使用第一个匹配项

使用自定义配置

保存配置为.py文件后，通过--config参数加载：

sloth --config myconfig.py examples/example1_labels.json

高级功能概览

除了基本的标注配置外，Sloth还支持更多高级功能：

自定义可视化项
自定义插入器
自定义标签容器格式
快捷键配置
多种标签格式支持

最佳实践建议

合理设计标注类型：根据实际需求定义足够详细但不冗余的标注类型
利用属性列表：为可能变化的属性（如对象ID）提供可选值列表
善用快捷键：为常用标注类型配置快捷键可显著提高工作效率
保持配置简洁：只包含项目真正需要的标注类型和属性

结语

通过本文，您应该已经掌握了Sloth的基本使用方法。从简单的默认配置启动到创建复杂的自定义配置，Sloth提供了灵活而强大的工具来满足各种图像标注需求。建议从简单配置开始，随着项目需求增长逐步探索更高级的功能。

下一步，您可以深入了解Sloth的高级配置选项、自定义可视化项开发以及如何支持自定义标签格式等主题，以充分发挥这个工具的潜力。

sloth

Sloth is a tool for labeling image and video data for computer vision research.

项目地址：https://gitcode.com/gh_mirrors/slot/sloth

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

1.13 K

271