OM1 的项目扩展与二次开发

2025-06-26 12:14:39作者：晏闻田Solitary

项目的基础介绍

OM1 是由 OpenmindAGI 开发的一个模块化 AI 运行时，旨在帮助开发者轻松地在数字环境和物理机器人（包括四足动物、TurtleBot 4 和人形机器人）上创建和部署多模态 AI 代理。OM1 代理能够处理各种输入，如网页数据、社交媒体、摄像头馈送和 LIDAR 等，同时支持物理交互，如导航和自然对话，使得用户能够以具体形态与高级 AI 模型（如 GPT-4o）进行交互。

项目的核心功能

模块化架构：采用 Python 开发，以便于简洁和无缝集成。
数据输入：轻松处理新数据。
硬件支持：通过插件支持新硬件，包括与 ROS2、Zenoh 和 CycloneDDS 的连接。
基于 Web 的调试显示：通过 WebSim（可在 http://localhost:8000/ 访问）进行可视化调试。
预配置端点：支持语音转文字、OpenAI 的 GPT-4o、DeepSeek 和多种视觉语言模型（VLMs）的预配置端点。

项目使用了哪些框架或库？

OM1 主要是基于 Python 开发的，使用了以下框架或库：

ROS2：机器人操作系统，用于机器人硬件的通信和控制。
Zenoh：数据共享框架，用于实时数据同步。
CycloneDDS：一个 DDS（数据分布服务）实现，用于机器人系统的通信。
OpenAI API：用于接入 OpenAI 的 GPT-4o 模型。
其他 Python 库，如 NumPy、Pandas、Matplotlib 等。

项目的代码目录及介绍

项目的代码目录结构大致如下：

OM1/
├── .github/
│   └── ...
├── config/
│   └── ...
├── docs/
│   └── ...
├── gazebo/
│   └── ...
├── src/
│   └── ...
├── system_hw_test/
│   └── ...
├── tests/
│   └── ...
├── .gitignore
├── .gitmodules
├── .pre-commit-config.yaml
├── .python-version
├── CONTRIBUTING.md
├── LICENSE
├── README.md
├── env.example
├── pyproject.toml
└── uv.lock