SkySense-O 遥感图像解译系统使用指南

2025-07-05 19:14:49作者：翟萌耘Ralph

项目概述

SkySense-O 是一款先进的遥感图像像素级解译系统，基于深度学习技术实现。该系统能够对输入的遥感图像进行智能分析，输出像素级别的语义分割结果。本指南将详细介绍如何使用该系统进行遥感图像解译。

系统运行

环境准备

在运行系统前，请确保已完成以下准备工作：

安装必要的Python环境依赖
下载并配置好预训练模型权重文件

启动系统

执行以下命令启动系统交互界面：

python demo.py

系统配置

配置界面

在交互界面中输入"setting"可进入配置模式：

Please input your target texts with ',' split: setting

配置界面提供以下参数设置选项：

Custom_image：自定义输入图像路径
Custom_text：自定义文本输入方式
Custom_save_path：自定义结果保存路径

输入"T"表示确认修改对应参数，直接回车则保持默认值。

输入模式详解

1. 开放世界模式

特点：

使用Sky-SA知识图谱中的节点类别作为文本输入
适用于通用遥感场景解译

使用方式：

Please input your target texts with ',' split: open_world

2. 数据集特定模式

特点：

输出特定数据集的预定义类别
适用于标准化数据集分析

支持的数据集标识符：

isa_idataset：ISAID数据集类别
oem_dataset：OEM数据集类别

使用示例：

Please input your target texts with ',' split: isa_idataset, oem_dataset

3. 自定义类别模式

特点：

完全自定义目标类别名称
适合特定应用场景需求

使用示例：

Please input your target texts with ',' split: 建筑物, 道路, 植被

输入输出配置

输入图像路径

系统运行时将提示输入待分析图像路径：

Please input your input image path: ./test_image.jpg

支持常见图像格式如JPG、PNG等，建议使用高分辨率遥感图像以获得最佳效果。

输出结果路径

可指定结果图像的保存位置：

Please input your save path: ./result.png

输出结果为带有语义标注的彩色图像，不同类别使用不同颜色区分。

技术原理

SkySense-O系统基于多模态深度学习架构，融合了视觉Transformer和语言模型的优势。系统通过以下步骤实现遥感图像解译：

图像特征提取：使用视觉编码器提取多尺度图像特征
文本特征编码：将输入文本转换为语义嵌入向量
跨模态对齐：建立视觉-语言特征关联
像素级分类：生成最终的分割掩码

应用建议

对于通用场景，建议首先尝试开放世界模式
当处理特定数据集时，使用对应的数据集标识符可获得更准确结果
自定义类别时应使用明确、具体的描述性词语
高分辨率图像可能需要更长的处理时间，请耐心等待

问题反馈

在使用过程中如遇到任何问题或有改进建议，欢迎通过邮件联系我们。我们将持续优化系统性能，为用户提供更好的遥感图像解译体验。

登录后查看全文

项目优选

收起

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力