零基础上手PSFusion：红外可见光图像融合的实战指南

2026-03-30 11:30:35作者：温玫谨Lighthearted

This is official Pytorch implementation of "Rethinking the necessity of image fusion in high-level vision tasks: A practical infrared and visible image fusion network based on progressive semantic injection and scene fidelity"

项目地址：https://gitcode.com/gh_mirrors/ps/PSFusion

图像融合技术在高阶视觉任务中扮演着关键角色，它能够将不同模态的图像信息进行有效整合，从而提升后续分析与处理的准确性。PSFusion作为一款基于PyTorch深度学习框架实现的红外与可见光图像融合系统，通过创新的“渐进式语义注入和场景保真”策略，为解决传统融合方法的局限提供了实用的解决方案。本文将从项目价值、技术原理、环境搭建、实战流程到进阶技巧，全方位带您零基础上手PSFusion，轻松掌握多模态图像合并的核心技术。

一、项目价值：重新定义图像融合的应用边界

在当今的计算机视觉领域，单一模态的图像往往难以满足复杂场景下的分析需求。例如，红外图像能够清晰地捕捉物体的热辐射信息，不受光照条件的影响，但缺乏细节纹理；而可见光图像则能提供丰富的色彩和细节信息，却在低光照环境下表现不佳。PSFusion的出现，正是为了将这两种模态的图像优势结合起来，生成既保留场景细节又突出关键目标的融合图像。

该项目不仅为科研人员提供了一个高效、可扩展的图像融合研究平台，也为工业界的实际应用提供了有力支持，如夜间监控、目标检测、医疗影像分析等领域。通过PSFusion，用户可以快速实现高质量的图像融合，为后续的高阶视觉任务奠定坚实基础。

二、技术原理：渐进式语义注入与场景保真的创新架构

PSFusion的核心技术在于其独特的网络架构设计，主要包含浅层细节融合模块（SDFM）和深层语义融合模块（PSFM）。

图1：PSFusion网络架构示意图，展示了从特征提取到图像融合的完整流程，体现了渐进式语义注入和场景保真的核心思想。

2.1 浅层细节融合模块（SDFM）

SDFM主要负责捕捉图像的浅层细节信息，基于通道-空间注意力机制，能够自适应地调整不同通道和空间位置的特征权重。

图2：SDFM模块结构示意图，展示了其如何通过注意力机制对红外（Fir）和可见光（Fvi）特征进行融合，生成融合特征Ffu。

2.2 深层语义融合模块（PSFM）

PSFM则专注于深层语义信息的融合，利用交叉注意力机制来建模不同模态特征之间的依赖关系，从而实现更高级别的语义理解和融合。

图3：PSFM模块结构示意图，展示了其通过投影、转换和注意力计算等步骤，对红外（Fir）和可见光（Fvi）特征进行深层语义融合的过程。

这两个模块协同工作，构成了PSFusion的核心，使得融合后的图像不仅保留了丰富的细节信息，还具备了良好的场景保真度。

三、环境搭建：PyTorch环境配置与依赖安装

3.1 准备工作

🔧 安装Python 确保系统中已安装Python 3.8或更高版本。可通过以下命令检查Python版本：

python --version  # 查看Python版本，确保为3.8及以上

🔧 创建虚拟环境 为保持项目环境的独立性和整洁，推荐使用venv创建虚拟环境：

python3 -m venv psfusion-env  # 创建名为psfusion-env的虚拟环境
source psfusion-env/bin/activate  # 在Linux/macOS下激活虚拟环境

注意事项：激活后，终端提示符会显示虚拟环境名称（psfusion-env），表示当前已在该环境中操作。

3.2 获取项目代码

🔧 克隆项目仓库 使用以下命令克隆PSFusion项目代码：

git clone https://gitcode.com/gh_mirrors/ps/PSFusion  # 克隆项目代码到本地
cd PSFusion  # 进入项目根目录

3.3 安装依赖包

🔧 安装必要的Python库 PSFusion主要依赖PyTorch、torchvision、kornia和Pillow等库，使用pip命令进行安装：

pip install torch==1.10.0 torchvision==0.11.0 kornia==0.6.5 Pillow>=8.3.2  # 安装指定版本的依赖包

验证提示：安装完成后，可尝试导入相关库，如import torch，若未报错则表示依赖安装成功。

四、实战流程：从数据集准备到模型测试与训练

4.1 数据集准备

🔧 下载并放置数据集 需要下载MSRS数据集，并将其放置在项目的datasets目录下。假设数据集解压后路径为datasets/MSRS。

4.2 模型测试

🔧 准备预训练模型 下载预训练模型文件（如best_model.pth），并将其放入results/PSFusion/checkpoints/目录。

🔧 执行测试命令 在项目根目录下，运行以下测试指令：

python test_Fusion.py --dataroot=datasets --dataset_name=MSRS --resume=results/PSFusion/checkpoints/best_model.pth
# --dataroot: 数据集根目录路径
# --dataset_name: 数据集名称，此处为MSRS
# --resume: 预训练模型文件路径

验证提示：执行后，程序会读取数据集并进行融合测试，生成的融合结果通常会保存在指定的输出目录中，查看输出目录是否有融合图像生成即表示测试成功。

图4：PSFusion与其他方法的图像融合效果对比，展示了PSFusion在保留细节和突出目标方面的优势。

4.3 模型训练

🔧 执行训练命令 确保MSRS数据集已正确放置在datasets/MSRS目录下，运行以下训练指令：

python train.py --dataroot=datasets/MSRS --name=PSFusion  # 开始模型训练，--name指定训练任务名称

注意事项：训练过程可能需要较长时间，具体取决于硬件配置。训练过程中会定期保存模型 checkpoint 到results/PSFusion/checkpoints/目录。

五、进阶技巧：提升图像融合效果与模型性能

5.1 数据集格式转换

在实际应用中，可能会遇到不同格式的数据集。可以使用项目中的create_dataset.py脚本对数据集进行格式转换，使其符合PSFusion的数据加载要求。例如，将其他格式的图像数据转换为PSFusion所需的训练数据格式。

5.2 模型性能评估指标

评估融合图像的质量是衡量模型性能的重要环节。常用的评估指标包括信息熵（IE）、互信息（MI）、结构相似性指数（SSIM）等。可以在测试完成后，使用相关工具计算这些指标来评估模型的融合效果。

5.3 超参数调优

通过调整训练过程中的超参数，如学习率、批大小、迭代次数等，可以进一步提升模型性能。可以参考options.py文件中的参数设置，结合实际数据集和硬件情况进行优化。例如，当遇到GPU内存不足时，可以适当减小批大小。

PSFusion

项目地址：https://gitcode.com/gh_mirrors/ps/PSFusion

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

468

461

pytorch

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Python

1.03 K

646