CityscapesScripts数据处理工具从入门到精通

2026-04-10 09:24:33作者：滕妙奇

CityscapesScripts是计算机视觉领域处理城市街景数据的专业工具集，它提供了从数据下载、格式转换到模型评估的完整解决方案。作为Cityscapes数据集的官方处理工具，该项目包含了丰富的脚本和图形界面工具，能够帮助研究人员高效处理城市街景图像数据，为语义分割、实例分割和3D目标检测等任务提供数据支持。本文将全面介绍CityscapesScripts的核心功能、使用方法和优化技巧，帮助读者快速掌握这一强大工具的使用。

如何高效认识CityscapesScripts工具集

工具集核心功能解析

CityscapesScripts是一个专为Cityscapes数据集设计的工具集合，主要包含以下核心模块：

数据下载模块：提供断点续传和选择性下载功能
数据预处理模块：实现多种标注格式之间的转换
可视化工具：支持标注结果和视差图的交互式查看
评估工具：提供多种任务的性能评估指标计算

这些模块协同工作，形成了从数据获取到模型评估的完整工作流，满足城市街景理解研究的全流程需求。

工具集目录结构详解

了解项目结构有助于快速定位所需功能：

cityscapesscripts/
├── annotation/    # 标注工具
├── download/      # 数据下载工具
├── evaluation/    # 评估脚本
├── helpers/       # 辅助函数和配置
├── preparation/   # 数据预处理工具
└── viewer/        # 数据查看工具

每个目录专注于特定功能，例如preparation目录包含各种数据格式转换工具，evaluation目录则提供不同任务的评估脚本。

核心工具的实用技巧

数据获取与环境配置指南

要开始使用CityscapesScripts，首先需要正确安装工具包并配置环境。通过pip可以快速安装基础版本：

python -m pip install cityscapesscripts

如果需要使用图形界面工具，如标注工具和查看器，应安装GUI增强版本：

python -m pip install cityscapesscripts[gui]

安装完成后，需要设置数据集路径环境变量，这是所有工具正常运行的基础：

export CITYSCAPES_DATASET=/path/to/your/cityscapes/dataset

小贴士：建议将环境变量设置添加到.bashrc或.bash_profile文件中，避免每次打开终端都需要重新设置。

数据下载工具的高级用法

CityscapesScripts提供了功能强大的下载工具csDownload，它位于cityscapesscripts/download/downloader.py。使用该工具可以灵活选择需要下载的数据类型：

csDownload

运行后会显示交互式菜单，可选择下载精细标注、粗略标注、视差图等不同数据包。工具支持断点续传，即使网络中断，重新运行后也会从上次中断的位置继续下载。

注意事项：完整数据集大小超过100GB，建议根据研究需求选择性下载，避免占用过多存储空间。

数据处理实战应用指南

标签系统的原理与应用

Cityscapes数据集的标签系统是数据处理的核心，定义在helpers/labels.py文件中。该文件包含了所有语义类别的详细信息，包括：

类别名称（name）
颜色编码（color）
训练ID（trainId）
类别是否在训练中使用（isTrainId）

理解标签系统对于正确处理和评估数据至关重要。例如，某些类别在训练时会被合并，通过trainId实现，这有助于减少类别数量，提高模型训练效率。

数据格式转换的实用方法

CityscapesScripts提供了多种数据格式转换工具，满足不同任务需求：

1. 生成训练标签图像

将原始多边形标注转换为带有训练ID的图像：

csCreateTrainIdLabelImgs

该工具位于preparation/createTrainIdLabelImgs.py，生成的图像可直接用于语义分割模型的训练。

2. 生成实例分割标签

对于实例分割任务，使用以下工具生成包含实例ID的图像：

csCreateTrainIdInstanceImgs

3. 转换为全景分割格式

将标注转换为COCO全景分割格式：

csCreatePanopticImgs

原理简析：全景分割结合了语义分割和实例分割，将图像中的每个像素分配给一个语义类别和一个实例ID，这需要特殊的数据格式支持，csCreatePanopticImgs工具正是为此设计。

数据可视化与分析技巧

专业查看工具的使用方法

CityscapesScripts提供了两个主要的可视化工具，帮助研究人员直观理解数据：

1. csViewer图像查看器

csViewer

该工具位于viewer/cityscapesViewer.py，支持图像和标注的叠加显示，可调整标注透明度，方便观察标注质量。

2. csLabelTool标注工具

csLabelTool

位于annotation/cityscapesLabelTool.py，提供交互式标注编辑功能，可用于修正或创建新的标注。

模型评估的完整流程

语义分割评估方法

评估语义分割模型性能的工具是csEvalPixelLevelSemanticLabeling，位于evaluation/evalPixelLevelSemanticLabeling.py。使用方法如下：

csEvalPixelLevelSemanticLabeling -pred <prediction_dir> -gt <ground_truth_dir>

该工具会计算多种评估指标，包括：

全局准确率（Global Accuracy）
平均交并比（Mean Intersection over Union, mIoU）
每类交并比（Per-class IoU）

实例分割与3D检测评估

对于实例级语义标注任务，使用专用评估工具：

csEvalInstanceLevelSemanticLabeling

而3D目标检测评估则使用：

csEvalObjectDetection3d

小贴士：评估结果会以JSON格式保存，可使用Python或其他工具进行进一步分析和可视化。

性能优化与高级配置

Cython加速配置方法

为提高评估速度，CityscapesScripts支持Cython加速。通过以下命令启用：

CYTHONIZE_EVAL=1 python setup.py build_ext --inplace

这会编译C扩展模块，显著提高评估脚本的运行速度，特别是在处理大量图像时效果明显。

多任务协同工作流

Cityscapes数据集支持多种计算机视觉任务，建议采用以下工作流程充分发挥其价值：

使用精细标注（gtFine）数据训练基础模型
利用粗略标注（gtCoarse）数据进行半监督学习或数据增强
结合语义分割和实例分割结果提升模型性能
使用3D检测评估工具验证空间感知能力

常见问题与解决方案

路径配置问题排查

路径配置错误是最常见的问题，解决方法包括：

确认CITYSCAPES_DATASET环境变量已正确设置
检查数据集目录结构是否符合要求
验证输入输出路径是否存在且有读写权限

格式兼容性处理

处理不同格式数据时，可使用以下技巧：

使用helpers/csHelpers.py中的辅助函数进行格式转换
利用preparation目录下的工具统一数据格式
参考docs/目录下的文档了解数据格式规范

通过掌握这些工具和技巧，研究人员可以高效处理Cityscapes数据集，加速城市街景理解相关研究的进展。无论是语义分割、实例分割还是3D目标检测任务，CityscapesScripts都能提供强大的支持，帮助研究者从数据处理中解放出来，专注于算法创新和模型优化。

cityscapesScripts

README and scripts for the Cityscapes Dataset

项目地址：https://gitcode.com/gh_mirrors/ci/cityscapesScripts

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

471

465

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Rust

2.08 K

216

CityscapesScripts数据处理工具从入门到精通

如何高效认识CityscapesScripts工具集

工具集核心功能解析

工具集目录结构详解

核心工具的实用技巧

数据获取与环境配置指南

数据下载工具的高级用法

数据处理实战应用指南

标签系统的原理与应用

数据格式转换的实用方法

数据可视化与分析技巧

专业查看工具的使用方法

模型评估的完整流程

语义分割评估方法

实例分割与3D检测评估

性能优化与高级配置

Cython加速配置方法

多任务协同工作流

常见问题与解决方案

路径配置问题排查

格式兼容性处理

热门内容推荐

最新内容推荐

项目优选

CityscapesScripts数据处理工具从入门到精通

如何高效认识CityscapesScripts工具集

工具集核心功能解析

工具集目录结构详解

核心工具的实用技巧

数据获取与环境配置指南

数据下载工具的高级用法

数据处理实战应用指南

标签系统的原理与应用

数据格式转换的实用方法

数据可视化与分析技巧

专业查看工具的使用方法

模型评估的完整流程

语义分割评估方法

实例分割与3D检测评估

性能优化与高级配置

Cython加速配置方法

多任务协同工作流

常见问题与解决方案

路径配置问题排查

格式兼容性处理

相关内容推荐

热门内容推荐

最新内容推荐

项目优选