simlingo 项目亮点解析

2025-06-17 14:05:22作者：农烁颖Land

1. 项目基础介绍

simlingo 是一个基于 Vision-Language-Action (VLA) 架构的开源项目，旨在实现仅视觉闭环的自动驾驶，并具备语言理解与执行的能力。该项目在 CARLA Leaderboard 和 Bench2Drive 上取得了领先的驾驶性能，同时支持视觉问答（VQA）、评论和指令跟随等语言功能。simlingo 项目的代码基于 Carla Garage，包含了数据收集、语言标签生成、梦境数据生成、基础和最终模型的训练，以及闭环驾驶和语言能力的评估。

2. 项目代码目录及介绍

simlingo 项目的代码目录结构清晰，主要包含以下部分：

assets: 存储项目所需的资源文件。
data: 包含数据集和相关文件。
dataset_generation: 用于生成和清理数据集的脚本。
leaderboard_autopilot 和 scenario_runner_autopilot: 修改版的 CARLA Leaderboard 和 Scenario Runner，便于数据收集。
simlingo_base_training 和 simlingo_training: 包含模型训练的相关脚本和代码。
team_code: 团队自定义的代码。
tools: 项目所需的工具脚本。
.gitignore: 指定 Git 忽略的文件。

此外，还包括了各种配置文件、环境设置脚本和训练脚本等。

3. 项目亮点功能拆解

simlingo 项目的主要亮点功能包括：

数据收集与处理: 使用 PDM-Lite 专家和定制化的数据代理进行数据收集，确保收集的数据适用于生成 VQA 和评论数据。
数据清洗: 提供脚本用于删除数据集中的无效或错误的路由。
语言标签生成: 利用 DriveLM 的脚本生成 VQA 标签，并使用 ChatGPT 进行数据增强。
模型训练: 提供了从基础训练到最终模型训练的完整流程和脚本。

4. 项目主要技术亮点拆解

simlingo 项目的主要技术亮点包括：

VLA 架构: 结合视觉、语言和动作，实现了更自然的自动驾驶决策过程。
高性能: 在 CARLA Leaderboard 和 Bench2Drive 上取得了优异的性能。
灵活性: 支持多种语言功能，如 VQA、评论和指令跟随。
易用性: 提供了详尽的设置指南和数据收集、训练脚本，便于用户快速上手。

5. 与同类项目对比的亮点

与同类项目相比，simlingo 的亮点在于：

全面的自动驾驶功能: 不仅实现了高效的驾驶性能，还集成了丰富的语言处理能力。
开放的数据集: 提供了完整的数据集，方便其他研究人员进行复现和进一步的研究。
社区支持: 在 GitHub 上有活跃的社区支持，便于问题的解答和功能的进一步开发。

登录后查看全文