Seurat中的伪批量分析方法详解

2025-07-01 01:41:02作者：伍霜盼Ellen

什么是伪批量分析

伪批量分析(Pseudobulk analysis)是单细胞RNA测序数据分析中常用的一种技术方法，它通过将多个单细胞的数据聚合起来，模拟传统批量RNA测序的数据特征。这种方法特别适用于需要比较不同处理组间基因表达差异的场景。

Seurat中的实现方法

在Seurat工具包中，AggregateExpression函数是实现伪批量分析的核心函数。该函数允许用户按照指定的分组变量对单细胞数据进行聚合，生成"伪批量"样本。

基本用法

最基本的伪批量分析可以按照单个分组变量进行：

bulk_data <- AggregateExpression(seurat_object, group.by = "treatment", return.seurat = TRUE)

多分组变量聚合

当需要同时考虑多个分组因素时，可以传入一个分组变量向量：

bulk_data <- AggregateExpression(seurat_object, 
                               group.by = c("treatment", "cell_type"), 
                               return.seurat = TRUE)

自定义细胞类型分组

在实际分析中，我们经常需要将多个细胞亚群合并为一个更大的组别进行分析。这时可以通过创建新的元数据列来实现：

# 创建新的分组变量
seurat_object$custom_group <- case_when(
  seurat_object$cell_type %in% c("T细胞", "B细胞", "NK细胞") ~ "淋巴细胞",
  seurat_object$cell_type %in% c("巨噬细胞", "树突细胞") ~ "髓系细胞",
  TRUE ~ "其他细胞"
)

# 使用自定义分组进行伪批量分析
bulk_data <- AggregateExpression(seurat_object, 
                               group.by = c("treatment", "custom_group"), 
                               return.seurat = TRUE)