NuScenes数据集转换为KITTI格式的注意事项与常见问题

2025-07-01 10:41:45作者：丁柯新Fawn

概述

NuScenes数据集是一个广泛应用于自动驾驶领域的大规模多模态数据集，而KITTI则是另一个广泛使用的自动驾驶基准数据集。在实际应用中，研究人员经常需要将NuScenes数据集转换为KITTI格式以便使用基于KITTI开发的算法。本文将详细介绍这一转换过程中的关键注意事项和常见问题。

转换后的参数差异

在标准KITTI格式中，通常包含17个关键参数：

帧标识(frame)
跟踪ID(track_id)
物体类型(type)
截断程度(truncated)
遮挡状态(occluded)
观察角度(alpha)
边界框坐标(bbox_left, bbox_top, bbox_right, bbox_bottom)
三维尺寸(height, width, length)
三维位置(x, y, z)
旋转角度(rotation_y)

然而，从NuScenes转换得到的KITTI格式数据可能包含额外的3个参数：

检测置信度(score)
激光雷达点数(num_lidar_points)
关键帧标识(keyframe)

这些额外参数实际上是NuScenes数据集提供的附加信息，在转换过程中被保留下来。研究人员可以根据实际需求选择使用这些额外信息或将其过滤掉。

帧重复问题

在转换过程中，用户可能会遇到某些帧被重复输出的情况。这通常是由于NuScenes数据集的多传感器配置和采样策略导致的。NuScenes数据集包含来自多个相机的数据，而KITTI格式通常只考虑单个前视相机。

解决这一问题的建议方法包括：

明确指定要转换的特定相机视角
在转换后对结果进行去重处理
检查转换脚本中的帧采样逻辑

环境配置问题

在执行转换脚本时，常见的环境配置问题包括：

数据集路径不正确：确保NuScenes数据集已正确下载并放置在指定路径
版本不匹配：确认使用的NuScenes数据集版本与脚本要求的版本一致
依赖包缺失：确保所有必要的Python依赖包已正确安装

最佳实践建议

预处理检查：在运行转换脚本前，先验证数据集完整性
参数定制：根据实际需求修改转换脚本，选择需要保留的字段
结果验证：转换完成后，抽样检查结果文件以确保格式正确
性能考虑：对于大规模数据集转换，考虑分批处理以节省内存

通过理解这些转换过程中的关键点和潜在问题，研究人员可以更高效地将NuScenes数据集应用于基于KITTI格式开发的算法中，同时充分利用NuScenes提供的丰富信息。

nuscenes-devkit

The devkit of the nuScenes dataset.

项目地址：https://gitcode.com/gh_mirrors/nu/nuscenes-devkit

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

455

437

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。