Seurat项目中RNA与SCT检测的merge函数行为差异解析

2025-07-02 01:58:39作者：谭伦延

R toolkit for single cell genomics

项目地址：https://gitcode.com/gh_mirrors/se/seurat

在单细胞RNA测序数据分析中，Seurat是一个广泛使用的R包。本文主要探讨Seurat中merge函数在处理RNA和SCT(Single Cell Transform)两种检测类型时的行为差异，以及这种差异对数据整合流程的影响。

merge函数的行为差异

当处理RNA检测类型时，merge函数会将多个Seurat对象合并为一个新对象，并为每个原始样本保留独立的counts、data和scale.data层。这意味着如果有5个样本合并，结果对象将包含5组对应的数据层。

然而，当处理SCT检测类型时，merge函数的行为则完全不同。无论合并多少个样本，结果对象都只会包含3个标准层(counts、data和scale.data)，不会为每个原始样本保留独立的数据层。

数据整合的影响

这种差异对后续的数据整合流程有重要影响：

RNA检测类型：由于保留了样本级别的数据层，可以直接按照官方流程进行IntegrateLayers操作，与大多数教程描述的情况一致。
SCT检测类型：由于数据层被"压缩"合并，用户可能会担心IntegrateLayers是否能正确工作。实际上，这是SCT检测类型的预期行为。当使用SCT方法时，IntegrateLayers能够正确处理这种情况，只要在调用RPCAIntegration或CCAIntegration时指定normalization.method = "SCT"参数即可。

工作流程建议

对于从多个独立Seurat对象开始的SCT整合分析，建议遵循以下步骤：

使用merge函数合并所有样本对象
确保使用SCT作为活跃检测
运行IntegrateLayers时明确指定normalization.method = "SCT"
后续分析可以按照标准流程进行

技术背景

这种差异源于SCT检测仍然基于Seurat的v3架构，而RNA检测已经更新到v5架构。v5架构引入了更灵活的层管理功能，而v3架构则采用更简单的数据结构。开发团队正在考虑如何使这种行为对用户更加透明。

理解这种差异对于正确执行单细胞数据整合分析至关重要，特别是当工作流程涉及多种检测类型转换时。用户应当根据所使用的检测类型调整对merge函数行为的预期，并相应调整后续分析步骤。

R toolkit for single cell genomics

项目地址：https://gitcode.com/gh_mirrors/se/seurat

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理