【亲测免费】 MiDaS 项目常见问题解决方案

2026-01-21 04:02:01作者：董斯意

Code for robust monocular depth estimation described in "Ranftl et. al., Towards Robust Monocular Depth Estimation: Mixing Datasets for Zero-shot Cross-dataset Transfer, TPAMI 2022"

项目地址：https://gitcode.com/gh_mirrors/mi/MiDaS

1. 项目基础介绍和主要编程语言

MiDaS 是一个用于单目深度估计的开源项目，由英特尔实验室（Intel Labs）开发。该项目的主要目标是提供一种鲁棒的单目深度估计方法，能够在不同数据集之间进行零样本跨数据集迁移。MiDaS 的核心算法基于深度学习，特别是卷积神经网络（CNN）和视觉变换器（Vision Transformers）。

MiDaS 项目的主要编程语言是 Python，依赖于深度学习框架如 PyTorch 和 TensorFlow。项目还提供了一些可选的依赖项，如 OpenVINO，用于在 Intel CPU 上进行推理加速。

2. 新手使用项目时需要注意的3个问题及详细解决步骤

问题1：环境配置问题

问题描述：新手在配置 MiDaS 项目的环境时，可能会遇到依赖项安装失败或版本不兼容的问题。

解决步骤：

创建虚拟环境：建议使用 Anaconda 或 Miniconda 创建一个独立的 Python 环境。
```
conda create -n midas-env python=3.10
conda activate midas-env
```
安装依赖项：根据项目提供的 environment.yaml 文件安装依赖项。
```
conda env create -f environment.yaml
```

检查依赖项版本：如果遇到版本冲突，可以手动安装特定版本的依赖项。

pip install torch==1.10.0+cu113 torchvision==0.11.1+cu113 -f https://download.pytorch.org/whl/torch_stable.html

问题2：模型权重下载问题

问题描述：新手在下载 MiDaS 模型的权重文件时，可能会遇到网络问题或下载速度慢的问题。

解决步骤：

手动下载权重文件：可以从项目的 GitHub 页面手动下载权重文件，并将其放置在 weights 文件夹中。
```
mkdir weights
cd weights
wget https://github.com/isl-org/MiDaS/releases/download/v3.1/dpt_beit_large_512.pt
```

使用代理：如果下载速度慢，可以尝试使用代理服务器。

export http_proxy=http://your-proxy-server:port
export https_proxy=http://your-proxy-server:port

验证文件完整性：下载完成后，验证文件的完整性。
```
md5sum dpt_beit_large_512.pt
```

问题3：推理速度慢的问题

问题描述：新手在使用 MiDaS 进行深度估计时，可能会发现推理速度较慢，尤其是在 CPU 上运行时。

解决步骤：

使用 GPU 加速：如果系统有 NVIDIA GPU，建议安装 CUDA 和 cuDNN，并在 PyTorch 中启用 GPU 支持。
```
pip install torch==1.10.0+cu113 torchvision==0.11.1+cu113 -f https://download.pytorch.org/whl/torch_stable.html
```
使用 OpenVINO 优化：如果使用 Intel CPU，可以安装 OpenVINO 工具包，并使用其提供的优化模型。
```
pip install openvino
```
选择合适的模型：根据需求选择合适的模型，如 dpt_swin2_tiny_256 或 dpt_levit_224，这些模型在速度和精度之间有更好的平衡。
```
python run.py --model_type dpt_swin2_tiny_256
```