Autoware城市数据集采集与处理技术实践
2025-05-24 05:18:30作者:龚格成
数据集背景与目标
Autoware自动驾驶框架需要针对城市复杂场景进行算法验证和性能测试,特别是隧道和桥梁等极端环境下的定位与建图能力。为此,技术团队开展了一次专门的城市数据集采集工作,旨在为Autoware的LOAM-Based Localization功能开发提供高质量的测试数据。
传感器配置方案
本次数据采集采用了专业级的传感器组合:
- 激光雷达:Hesai Pandar XT32,这是一款32线机械式激光雷达,具有360°水平视场角和40°垂直视场角
- 组合导航系统:Applanix POS LVX GNSS/INS,提供厘米级定位精度和稳定的姿态测量
传感器间通过PPS脉冲信号和GPRMC时间信息进行硬件级时间同步,确保数据的时间一致性。激光雷达采用Strongest回波模式工作,优先记录最强反射信号。
数据采集路线规划
采集路线经过精心设计,覆盖了典型的城市复杂场景:
- 长距离隧道场景:测试GNSS信号完全缺失环境下的定位能力
- 大型桥梁场景:评估高度变化和开阔水域环境对传感器的影响
- 城市道路混合场景:包含常规道路、交叉路口等典型城市元素
数据处理流程
原始数据格式
- 激光雷达数据:PCAP格式原始数据包,包含点云信息和时间同步标记
- GNSS/INS数据:T04格式原始数据及处理后的文本格式,包含位置、姿态和速度信息
- ROS2数据包:包含传感器原始话题和预处理数据
坐标系统说明
- GNSS/INS采用NED(北-东-地)坐标系
- 激光雷达坐标系定义:X轴向后,Y轴向右,Z轴向上
- 传感器间标定参数精确测量,包含位置偏移和姿态旋转
点云生成技术
使用LOAM算法框架进行点云建图,处理流程包括:
- 点云特征提取:分离角点和平面点特征
- 运动补偿:补偿车辆运动造成的点云畸变
- 地图优化:结合GNSS/INS信息进行全局优化
- 降采样处理:采用0.2米体素网格进行点云精简
数据集技术特点
- 多场景覆盖:完整包含城市典型复杂场景
- 时间同步精度:硬件级同步确保数据时间一致性
- 数据完整性:提供原始数据和处理后数据
- 坐标系明确:所有传感器坐标系关系清晰定义
- 动态物体标记:原始数据中包含动态物体信息
应用价值
该数据集特别适用于以下自动驾驶技术研发:
- 无GNSS环境下的定位算法测试
- 激光雷达建图算法评估
- 多传感器融合系统验证
- 自动驾驶系统在极端场景下的鲁棒性测试
技术挑战与解决方案
在数据采集和处理过程中,团队遇到了若干技术挑战:
- 时间同步问题:初期数据存在微小时间偏差,通过优化硬件连接和增加时间校验标记解决
- 动态物体干扰:采用基于运动一致性的滤波算法减少动态物体对地图的影响
- 大场景建图:使用MGRS投影坐标系处理大范围场景,避免坐标溢出
- 传感器标定:通过多位置观测和优化算法提高标定精度
数据集使用建议
对于希望使用该数据集的研究人员,建议:
- 首先了解各传感器的坐标系定义
- 注意GNSS/INS数据的后处理特性
- 对于定位测试,建议从部分场景开始逐步扩展到完整路线
- 可利用提供的不同特征点云进行算法针对性测试
该数据集的建立为Autoware框架的城市自动驾驶能力提升提供了重要的测试基础,特别是为隧道、桥梁等复杂场景下的定位算法开发提供了宝贵的真实数据支持。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust078- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
Hy3-previewHy3 preview 是由腾讯混元团队研发的2950亿参数混合专家(Mixture-of-Experts, MoE)模型,包含210亿激活参数和38亿MTP层参数。Hy3 preview是在我们重构的基础设施上训练的首款模型,也是目前发布的性能最强的模型。该模型在复杂推理、指令遵循、上下文学习、代码生成及智能体任务等方面均实现了显著提升。Python00
项目优选
收起
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
434
78
暂无描述
Dockerfile
690
4.46 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
407
326
Ascend Extension for PyTorch
Python
548
671
deepin linux kernel
C
28
16
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.59 K
925
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
955
930
本项目是CANN开源社区的核心管理仓库,包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息
650
232
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.08 K
564
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
C
436
4.43 K