Marigold项目深度图推理优化与噪声问题分析

2025-06-29 19:42:20作者：邵娇湘

Marigold: Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation

项目地址：https://gitcode.com/gh_mirrors/ma/Marigold

深度图推理性能优化

在Marigold项目中，当使用自定义数据集训练模型并进行推理时，可能会遇到推理速度缓慢的问题。经过技术分析，这主要与两个关键参数设置有关：去噪步骤数(denoise_steps)和集成大小(ensemble_size)。

参数优化建议：

将denoise_steps从默认的50减少到10-20之间
将ensemble_size从10降低到1-3之间
这两个参数的乘积直接影响总计算量，适当降低可显著提升推理速度

深度图噪声问题分析

在模型推理过程中出现的深度图噪声问题，可能由以下几个技术因素导致：

训练数据质量

使用8位相对深度图会损失精度，建议尽可能使用更高位深的深度数据
训练数据集的多样性不足可能导致模型泛化能力差
训练迭代次数不足也会影响最终模型质量

模型配置问题

检查是否使用了正确的预训练模型(checkpoint)
确保替换的unet文件夹与模型架构兼容
数据处理流程中可能存在不匹配的配置

深度图格式建议

对于深度图格式选择，技术专家建议：

避免使用8位深度图，这会显著降低深度估计精度
优先考虑16位或32位浮点格式的深度图
如果必须使用8位格式，需要特别注意训练数据的归一化处理

最佳实践方案

基于项目经验，推荐以下优化方案：

首先使用项目提供的标准checkpoint进行测试，确认基线性能
逐步调整denoise_steps和ensemble_size参数，找到速度与质量的平衡点
检查训练数据的分布和质量，确保覆盖各种场景
适当增加训练迭代次数，特别是对于自定义数据集
考虑使用更高精度的深度图格式进行训练

通过以上优化措施，可以显著改善Marigold项目在自定义数据集上的推理速度和深度图质量。

Marigold: Repurposing Diffusion-Based Image Generators for Monocular Depth Estimation

项目地址：https://gitcode.com/gh_mirrors/ma/Marigold

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。