NuScenes数据集转KITTI格式时的数据维度问题解析

2025-07-01 16:38:56作者：傅爽业Veleda

在使用NuScenes-devkit工具将NuScenes数据集转换为KITTI格式时，开发者可能会遇到输出数据维度不匹配的问题。本文深入分析这一现象的原因，并提供解决方案。

问题现象

当使用NuScenes-devkit中的export_kitti.py脚本转换数据时，输出的标注文件每行包含16个元素，而标准的KITTI格式通常只需要15个元素。具体表现为：

['barrier', '0.00', '4', '-10.00', '0.00', '519.72', '58.90', '575.55', '1.1', '1.64', '0.36', '-17.09', '2.14', '26.36', '0.45', '0.0000']

原因分析

经过对NuScenes-devkit源码的审查，发现这种差异是设计上的考虑而非错误。标准的KITTI格式确实只需要15个元素，但NuScenes-devkit在转换时额外添加了一个分类置信度分数作为第16个元素。

这个设计决策源于NuScenes数据集本身的特点。NuScenes数据集中的每个检测框都带有检测置信度分数，而原始KITTI格式没有这个字段。为了保留这一重要信息，转换脚本将其添加在行末。

技术细节

在转换过程中，脚本会处理以下关键信息：

对象类别（如car、pedestrian等）
截断程度（0-1之间的数值）
遮挡程度（0-3的整数）
观察角度（alpha值）
2D边界框坐标（left, top, right, bottom）
3D尺寸（height, width, length）
3D位置（x, y, z）
旋转角度（rotation_y）
检测置信度（额外添加的分数）

解决方案

开发者可以根据实际需求选择以下处理方式：

保留完整信息：直接使用16元素的格式，这不会影响大多数检测算法的运行，反而提供了更多信息。
裁剪为15元素：如果下游应用严格要求KITTI标准格式，可以简单地截取前15个元素。
自定义处理：修改export_kitti.py脚本，在输出前调整数据格式。

最佳实践建议

对于大多数应用场景，建议保留16元素的完整格式，因为：

检测置信度是评估检测质量的重要指标
大多数现代检测算法都能处理额外的字段
不会影响标准KITTI格式字段的读取

如果确实需要严格兼容KITTI格式，可以在数据加载阶段进行简单处理，而不是修改原始转换脚本，这样既保持了数据完整性，又满足了格式要求。

总结

NuScenes-devkit在转换为KITTI格式时添加置信度分数的行为是经过深思熟虑的设计选择，而非程序错误。开发者应当根据具体应用场景决定如何处理这个额外的字段。理解这一设计决策有助于更好地利用NuScenes数据集进行3D目标检测相关的研究和开发工作。

nuscenes-devkit

The devkit of the nuScenes dataset.

项目地址：https://gitcode.com/gh_mirrors/nu/nuscenes-devkit

登录后查看全文

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

455

437

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

454

5.07 K