【亲测免费】 MiDaS 官方教程

2026-01-16 10:18:51作者：傅爽业Veleda

Code for robust monocular depth estimation described in "Ranftl et. al., Towards Robust Monocular Depth Estimation: Mixing Datasets for Zero-shot Cross-dataset Transfer, TPAMI 2022"

项目地址：https://gitcode.com/gh_mirrors/mi/MiDaS

1. 项目介绍

MiDaS(MIDAS - Monocular Depth Estimation using a Single Image) 是一个用于单目图像深度估计的轻量级深度学习框架。由 ISL-org 团队开发，它提供了高效的预训练模型，可以在各种设备上实时运行。MiDaS 使用 PyTorch 框架构建，旨在促进计算机视觉领域的研究和应用。

2. 项目快速启动

环境准备

确保已安装以下依赖项：

Python 3.6+
PyTorch >= 1.7.0
torchvision

安装 MiDaS

通过 Git 克隆项目到本地：

git clone https://github.com/isl-org/MiDaS.git
cd MiDaS

然后安装依赖库：

pip install -r requirements.txt

预测单张图片

首先下载预训练模型，例如 MiDaS_small.pth，将其放置在 /models 目录下。接下来预测一张名为 test.jpg 的图片：

import torch
from midas.models import load_model
from PIL import Image

model = load_model('MiDaS_small')
model.eval()

image_path = 'test.jpg'
img = Image.open(image_path).convert('RGB').resize((640, 480))
input_tensor = torch.from_numpy(np.array(img)[np.newaxis, :, :, :]).float()
with torch.no_grad():
    output = model(input_tensor)

output = output.squeeze().numpy()
depth_map = output / np.max(output)
Image.fromarray(depth_map * 255).save('predicted_depth.png')

3. 应用案例和最佳实践

MiDaS 可用于多种应用场景，如自动驾驶、无人机导航和增强现实。最佳实践包括：

数据预处理：在输入模型之前，通常需要将图像调整到特定尺寸（如 640x480）。
后处理：预测出的深度图可能需要进行归一化、上界限制等操作以适应具体应用需求。
性能优化：对于实时应用，可以利用 GPU 加速或者对模型进行量化以减小内存占用和提高速度。

4. 典型生态项目

Depth-Hub: 提供了各种深度估算模型的比较和基准测试资源，包括 MiDaS。Link
PyTorch Hub: MiDaS 的预训练模型可直接从 PyTorch Hub 加载，方便集成进其他项目。
OpenCV DNN: 可以将 MiDaS 集成到 OpenCV 的深度学习模块（DNN），实现跨平台的应用。

本教程涵盖了 MiDaS 项目的基本使用，更多详细信息及最新更新请参考项目 GitHub 页面：https://github.com/isl-org/MiDaS

Code for robust monocular depth estimation described in "Ranftl et. al., Towards Robust Monocular Depth Estimation: Mixing Datasets for Zero-shot Cross-dataset Transfer, TPAMI 2022"

项目地址：https://gitcode.com/gh_mirrors/mi/MiDaS

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力