Gaussian Splatting项目中处理不同尺寸输入图像的技术方案

2025-05-13 15:41:48作者：丁柯新Fawn

项目背景

Gaussian Splatting是一个基于3D高斯分布的实时渲染系统，它能够从多视角图像中重建高质量的3D场景。在实际应用中，用户经常会遇到输入图像尺寸不一致的情况，这给3D重建带来了挑战。

问题分析

在标准流程中，Gaussian Splatting通常假设输入图像具有相同的尺寸和相机参数。然而，现实场景中我们可能遇到：

使用不同设备拍摄的图像
同一设备在不同变焦倍数下拍摄的图像
经过裁剪或旋转处理的图像

这些情况会导致图像尺寸不一致，直接使用标准流程会出现兼容性问题。

技术解决方案

方案一：预处理统一尺寸

最直接的方法是预处理阶段将所有图像调整为统一尺寸：

确定目标分辨率
保持原始图像宽高比进行缩放
必要时进行填充(padding)处理

这种方法简单有效，但会丢失原始图像的某些信息，特别是当不同图像间焦距差异较大时。

方案二：多相机模型支持

更专业的解决方案是利用COLMAP的多相机模型功能：

图像组织：按相机模型创建子文件夹
- 例如：images/camera_model_1/、images/camera_model_2/等

特征提取：使用特殊参数运行COLMAP

colmap feature_extractor --ImageReader.single_camera_per_folder 1

稀疏重建：COLMAP会自动为每个子文件夹估计独立的相机参数
代码适配：修改Gaussian Splatting的dataset_readers.py
- 处理子文件夹路径问题
- 确保能正确加载不同相机模型对应的图像

实现细节

对于方案二，关键修改点在于readColmapCameras函数的适配：

image_path = os.path.join(images_folder, os.path.basename(extr.name))
image_name = os.path.basename(image_path).split(".")[0]
try:
    image = Image.open(image_path)
except FileNotFoundError:
    # 处理多相机模型情况
    image_path = os.path.join(images_folder, extr.name)
    image_name = extr.name.split(".")[0] 
    image = Image.open(image_path)

这段代码首先尝试标准路径，如果失败则尝试从子文件夹加载图像，从而兼容多相机模型配置。