【亲测免费】 PMRF项目使用与启动教程
2026-01-30 05:01:53作者:魏献源Searcher
1. 项目介绍
PMRF(Posterior-Mean Rectified Flow)是一个新颖的图片复原算法,该算法可以证明近似最优估计器,在完美的感知质量约束下最小化均方误差(MSE)。本项目是ICLR 2025会议论文的官方实现,旨在实现最小MSE的图片复原,同时保证图片的逼真度。
2. 项目快速启动
环境搭建
首先,你需要创建一个conda环境并安装所需的依赖:
conda create -n pmrf python=3.10
conda activate pmrf
conda install pytorch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 pytorch-cuda=11.8 -c pytorch -c nvidia
conda install lightning==2.3.3 -c conda-forge
pip install opencv-python==4.10.0.84 timm==1.0.8 wandb==0.17.5 lovely-tensors==0.1.16 torch-fidelity==0.3.0 einops==0.8.0 dctorch==0.1.2 torch-ema==0.3
pip install natten==0.17.1+torch230cu118 -f https://shi-labs.com/natten/wheels
pip install nvidia-cuda-nvcc-cu11
pip install basicsr==1.4.2
pip install git+https://github.com/toshas/torch-fidelity.git
pip install lpips==0.1.4
pip install piq==0.8.0
pip install huggingface_hub==0.24.5
运行示例
为了快速使用模型,我们提供了Hugging Face checkpoint。以下是一个快速运行的示例:
python inference.py \
--ckpt_path ohayonguy/PMRF_blind_face_image_restoration \
--ckpt_path_is_huggingface \
--lq_data_path /path/to/lq/images \
--output_dir /path/to/results/dir \
--batch_size 64 \
--num_flow_steps 25
如果你想要使用本地模型checkpoint,可以按以下方式运行:
python inference.py \
--ckpt_path ./checkpoints/blind_face_restoration_pmrf.ckpt \
--lq_data_path /path/to/lq/images \
--output_dir /path/to/results/dir \
--batch_size 64 \
--num_flow_steps 25
请注意,我们的盲脸图片复原模型是针对方形和对齐的脸部图片训练的。如果要复原包含多个脸部的一般内容图片,你可能需要使用我们的Hugging Face demo。
3. 应用案例和最佳实践
案例一:盲脸图片复原
使用PMRF模型进行盲脸图片复原时,可以参考以下步骤:
- 准备低质量的图片作为输入。
- 使用
inference.py脚本进行图片复原。 - 可以使用提供的Hugging Face checkpoint或本地checkpoint。
最佳实践
- 确保输入图片的尺寸符合模型训练时的尺寸要求。
- 根据具体应用场景调整
num_flow_steps参数以获得最佳效果。
4. 典型生态项目
PMRF作为图像复原领域的一个先进算法,可以与其他图像处理项目配合使用,例如:
- 使用PMRF进行图像预处理,然后输入到其他图像识别或生成模型中。
- 结合PMRF和其他图像质量评估工具,如lpips和piq,进行综合图像质量评估。
以上就是PMRF项目的基本介绍和快速启动指南。希望对你有所帮助!
登录后查看全文
热门项目推荐
相关项目推荐
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
new-apiAI模型聚合管理中转分发系统,一个应用管理您的所有AI模型,支持将多种大模型转为统一格式调用,支持OpenAI、Claude、Gemini等格式,可供个人或者企业内部管理与分发渠道使用。🍥 A Unified AI Model Management & Distribution System. Aggregate all your LLMs into one app and access them via an OpenAI-compatible API, with native support for Claude (Messages) and Gemini formats.JavaScript01
idea-claude-code-gui一个功能强大的 IntelliJ IDEA 插件,为开发者提供 Claude Code 和 OpenAI Codex 双 AI 工具的可视化操作界面,让 AI 辅助编程变得更加高效和直观。Java00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility.Kotlin06
ebook-to-mindmapepub、pdf 拆书 AI 总结TSX00
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
515
3.7 K
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
874
546
Ascend Extension for PyTorch
Python
317
362
暂无简介
Dart
759
182
React Native鸿蒙化仓库
JavaScript
299
347
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
334
156
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.31 K
734
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
12
1
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
110
128