Label Studio 中导入本地图片及预标注的最佳实践

2025-05-09 14:05:58作者：冯梦姬Eddie

Label Studio 是一款强大的数据标注工具，在实际使用过程中，很多用户会遇到如何正确导入本地存储的图片并加载预标注数据的问题。本文将详细介绍这一过程中的关键技术和注意事项。

本地图片导入的正确方式

Label Studio 不支持直接使用文件系统的绝对路径来引用图片（如 /root/datasets/test/1.jpg）。系统采用了一种特殊的本地文件服务机制，需要按照以下步骤配置：

环境变量设置：必须设置 LABEL_STUDIO_LOCAL_FILES_SERVING_ENABLED=true 环境变量同时定义 LABEL_STUDIO_LOCAL_FILES_DOCUMENT_ROOT 指向图片所在的根目录（如 /root/datasets）
图片引用格式：在任务JSON文件中，需要使用特定的URL格式引用图片：
```
"/data/local-files/?d=test/1.jpg"
```
其中 test/1.jpg 是相对于文档根目录的相对路径

预标注数据的正确格式

当导入包含预标注的矩形框数据时，需要特别注意以下几点：

标注配置一致性：项目中的标注配置（XML格式）必须包含与JSON文件中完全匹配的标签定义。例如，如果JSON中使用：
```
"from_name": "label"
```
那么标注配置中必须有对应的：
```
<RectangleLabels name="label" toName="image">
  <Label value="Person" background="green"/>
</RectangleLabels>
```
标签大小写敏感： Label Studio 对标签名称是大小写敏感的，"Person"和"person"会被视为不同的标签
坐标格式验证：确保所有坐标值（x, y, width, height）都是数字且在合理范围内旋转角度（rotation）也必须是有效的数值

实用技巧与经验分享

文件上传顺序：建议先通过"Cloud Storage"功能上传图片（但不立即同步）然后再导入包含预标注的JSON文件
调试建议：当图片无法显示时，可以：
- 检查环境变量是否设置正确
- 确认文件权限是否允许Label Studio进程访问
- 验证JSON中的路径格式是否正确
性能优化：对于大量图片，建议：
- 将图片组织在同一个目录下
- 使用相对路径引用
- 考虑使用符号链接简化目录结构

通过遵循这些最佳实践，用户可以高效地在Label Studio中导入本地图片和预标注数据，为后续的标注工作打下良好基础。

登录后查看全文

项目优选

收起

deepin linux kernel

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

昇腾LLM分布式训练框架

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。