【亲测免费】 FoundationStereo: 开源项目使用教程

2026-01-30 04:19:33作者：昌雅子Ethen

FoundationStereo

可用于输入立体图像对输出稠密视差图，进而转换为深度图或3D点云。该项目是CVPR 2025 Oral（最佳论文提名）的官方实现，具备跨域零样本泛化能力，采用大尺度合成数据集和优化网络架构，在Middlebury等排行榜获第一。

项目地址：https://gitcode.com/gh_mirrors/fo/FoundationStereo

1. 项目介绍

FoundationStereo 是由 NVlabs 开发的一款用于立体深度估计的开源项目。该项目设计的目的是实现强大的零样本泛化能力，即在不针对特定领域进行微调的情况下，模型能够跨领域地工作。FoundationStereo 通过构建一个大规模的合成训练数据集，并设计了一系列网络架构组件，以增强模型的扩展性和鲁棒性。该模型在 Middlebury 和 ETH3D 排行榜上取得了第一名。

2. 项目快速启动

首先，您需要创建一个虚拟环境并激活它：

conda env create -f environment.yml
conda activate foundation_stereo

接着，下载预训练模型并放置在指定的目录下：

# 将下载的模型文件夹（例如：23-51-11）放置在 ./pretrained_models/ 目录下

运行以下命令来执行演示：

python scripts/run_demo.py --left_file ./assets/left.png --right_file ./assets/right.png --ckpt_dir ./pretrained_models/model_best_bp2.pth --out_dir ./test_outputs/

请确保输入的左右图像是经过纠正和去畸变的，且左右图像之间的极线是水平的。

3. 应用案例和最佳实践

输入图像要求

输入的左右图像应当是经过纠正和去畸变的，极线应当水平。
推荐使用无损失压缩的 PNG 格式文件。
该方法在 RGB 立体图像上效果最佳，但也支持单色或红外立体图像。

参数调整

对于高分辨率图像（分辨率大于1000px），可以通过 --hiera 1 选项开启分层推理以提高性能。
如果需要更快的推理速度，可以降低输入图像的分辨率，例如使用 --scale 0.5，并减少 refine 迭代次数，如 --valid_iters 16。

ONNX/TensorRT 推理（实验性）

要创建 ONNX 模型，请进行相应的代码更改并运行提供的脚本。
转换 ONNX 到 TensorRT 可以获得更快的推理速度。

4. 典型生态项目

FoundationStereo 作为立体深度估计的基座模型，可以与其他开源项目结合，例如：

与 DINOv2、DepthAnything V2 等模型结合，以进一步提高性能。
集成到机器人导航、自动驾驶车辆或增强现实系统中，提供实时的深度信息。

请根据实际需求选择合适的项目进行集成和扩展。

FoundationStereo

可用于输入立体图像对输出稠密视差图，进而转换为深度图或3D点云。该项目是CVPR 2025 Oral（最佳论文提名）的官方实现，具备跨域零样本泛化能力，采用大尺度合成数据集和优化网络架构，在Middlebury等排行榜获第一。

项目地址：https://gitcode.com/gh_mirrors/fo/FoundationStereo

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

昇腾LLM分布式训练框架

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。