Segment Anything in 3D 项目教程

2026-01-17 08:16:53作者：董斯意

SegmentAnythingin3D

Segment Anything in 3D with NeRFs (NeurIPS 2023 & IJCV 2025)

项目地址：https://gitcode.com/gh_mirrors/se/SegmentAnythingin3D

项目介绍

Segment Anything in 3D 是一个基于神经辐射场（NeRF）的项目，旨在将2D图像的分割信息转移到3D空间中。该项目通过利用辐射场作为廉价且现成的先验，设计了一种高效的解决方案，以生成高质量的3D分割结果。SA3D 框架允许用户通过单次手动提示在单个渲染视图中获取任何目标对象的3D分割结果，整个过程可以在大约2分钟内完成，无需任何工程优化。

项目快速启动

以下是快速启动 Segment Anything in 3D 项目的步骤：

克隆项目仓库

git clone https://github.com/Jumpat/SegmentAnythingin3D.git
cd SegmentAnythingin3D

创建并激活虚拟环境

conda create -n sa3d python=3.10
conda activate sa3d

安装依赖

pip install -r requirements.txt

安装 SAM 和 Grounding-DINO

# 安装 SAM
mkdir dependencies
cd dependencies
mkdir sam_ckpt
cd sam_ckpt
wget https://dl.fbaipublicfiles.com/segment_anything/sam_vit_h_4b8939.pth
git clone git@github.com:facebookresearch/segment-anything.git
cd segment-anything
pip install -e .

# 安装 Grounding-DINO
git clone https://github.com/IDEA-Research/GroundingDINO.git
cd GroundingDINO/
pip install -e .
mkdir weights
cd weights
wget https://github.com/IDEA-Research/GroundingDINO/releases/download/v0.1.0-alpha/groundingdino_swint_ogc.pth

下载数据

项目提供了一些数据集的配置文件，包括 Foward-facing（LLFF）和 Inward-facing（mip-NeRF360 LERF）等。

应用案例和最佳实践

SA3D 项目在不同场景中展示了其有效性，特别是在3D场景感知方面。以下是一些应用案例：

3D 场景分割

通过 SA3D，用户可以快速对3D场景中的对象进行分割，这对于虚拟现实、游戏开发和建筑设计等领域非常有用。

自动化3D建模

SA3D 可以与现有的3D建模工具结合，实现自动化3D建模，提高建模效率和准确性。

增强现实应用

在增强现实（AR）应用中，SA3D 可以帮助准确地识别和分割现实世界中的对象，从而提供更丰富的交互体验。

典型生态项目

Segment Anything in 3D 项目与多个生态项目紧密结合，以下是一些典型的生态项目：

NeRFs

神经辐射场（NeRFs）是 SA3D 的核心技术之一，它通过学习场景的辐射场来生成高质量的3D模型。

Grounding-DINO

Grounding-DINO 是一个用于目标检测和分割的模型，它与 SA3D 结合使用，可以提高3D分割的准确性和效率。

MobileSAM

MobileSAM 是一个轻量级的分割模型，SA3D 支持使用 MobileSAM 作为分割模型，以适应移动设备和资源受限的环境。

通过这些生态项目的结合，SA3D 在3D分割领域展现出强大的潜力和广泛的应用前景。

SegmentAnythingin3D

Segment Anything in 3D with NeRFs (NeurIPS 2023 & IJCV 2025)

项目地址：https://gitcode.com/gh_mirrors/se/SegmentAnythingin3D

登录后查看全文

项目优选

收起

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。