MonoPort 的安装和配置教程

2025-05-26 20:14:02作者：卓艾滢Kingsley

项目地址：https://gitcode.com/gh_mirrors/mo/MonoPort

项目基础介绍

MonoPort 是一个开源项目，它能够通过单目摄像头捕捉到实时的人体体积视频。这个项目在 SIGGRAPH 2020 Real-Time Live 和 ECCV 2020 上展示，由 Ruilong Li 等人开发。它使用了单目摄像头和深度学习技术，可以实现无需复杂装置即可捕获完整人体动作的体积视频，适用于虚拟现实、增强现实和远程呈现等领域。

项目的主要编程语言是 Python。

项目使用的关键技术和框架

PyTorch: 用于深度学习模型的框架。
PyOpenGL: 用于图形渲染。
ImplicitSegCUDA: 用于隐式表面分割的 CUDA 加速库。
human_inst_seg: 人体实例分割技术。
streamer_pytorch: 用于数据流处理的 PyTorch 工具。
human_det: 人体检测技术。

项目安装和配置的准备工作

在开始安装 MonoPort 之前，请确保您的系统满足以下要求：

操作系统：Ubuntu（推荐）
Python 版本：Python 3.7
GPU：NVIDIA GeForce RTX 2080Ti 或相似性能的显卡（推荐）
显卡驱动：安装最新的 NVIDIA 驱动程序
CUDA：匹配您 GPU 的 CUDA 版本

请确保您的系统中已安装以下依赖项：

Python 3.7
PyOpenGL 3.1.5
PyTorch（测试版本为 1.4.0）

详细的安装步骤

克隆项目仓库

打开终端，执行以下命令来克隆项目仓库：

git clone https://github.com/Project-Splinter/MonoPort.git
cd MonoPort

下载预训练模型

在项目目录下，使用以下命令下载预训练模型：
```
sh scripts/download_model.sh
```
安装依赖

使用以下命令安装项目所需的所有依赖：
```
pip install -r requirements.txt
```

运行项目

根据您的需求，选择以下任一命令启动服务：

使用摄像头输入：

python RTL/main.py --use_server --ip <YOUR_IP_ADDRESS> --port 5555 --camera -- netG.ckpt_path ./data/PIFu/net_G netC.ckpt_path ./data/PIFu/net_C

使用图片文件夹输入：

python RTL/main.py --use_server --ip <YOUR_IP_ADDRESS> --port 5555 --image_folder <IMAGE_FOLDER> -- netG.ckpt_path ./data/PIFu/net_G netC.ckpt_path ./data/PIFu/net_C

使用视频输入：

python RTL/main.py --use_server --ip <YOUR_IP_ADDRESS> --port 5555 --videos <VIDEO_PATH> -- netG.ckpt_path ./data/PIFu/net_G netC.ckpt_path ./data/PIFu/net_C

请将 <YOUR_IP_ADDRESS>、<IMAGE_FOLDER> 和 <VIDEO_PATH> 替换为实际的 IP 地址、图片文件夹路径和视频路径。