Scanpy中rank_genes_groups绘图函数的使用注意事项

2025-07-04 17:19:56作者：史锋燃Gardner

在使用Scanpy进行单细胞数据分析时，rank_genes_groups函数是一个常用的功能，它可以帮助我们识别不同细胞群之间的差异表达基因。然而，在使用过程中可能会遇到一些参数设置上的困惑，特别是groups参数的使用。

问题背景

在Scanpy分析流程中，我们通常会先进行聚类分析（如leiden聚类），然后使用rank_genes_groups函数寻找每个聚类中特异性表达的基因。最后通过rank_genes_groups可视化函数来展示结果。但有时用户可能会遇到"ValueError: no field of name [field name]"的错误提示。

正确使用方法

rank_genes_groups函数的groups参数实际上是指定要展示哪些聚类组的结果，而不是指定聚类方法的名称。例如：

import scanpy as sc

# 加载示例数据
adata = sc.datasets.pbmc3k_processed()

# 进行leiden聚类
sc.tl.leiden(adata, key_added="leiden", flavor="igraph", n_iterations=2)

# 计算差异表达基因
sc.tl.rank_genes_groups(adata, groupby="leiden")

# 正确可视化特定聚类组的差异基因
sc.pl.rank_genes_groups(adata, groups=["0", "1"])

参数解析

groupby参数：在rank_genes_groups函数中，这个参数指定使用哪个聚类结果来计算差异基因，如"leiden"。
groups参数：在可视化函数中，这个参数应该传入具体的聚类组名称（如"0"、"1"等），而不是聚类方法的名称。

常见误区

许多用户容易混淆这两个参数的作用，特别是在连续使用多个Scanpy函数时。关键要理解：

计算差异表达时，我们指定的是使用哪个聚类结果（如leiden、louvain等）
可视化时，我们指定的是要展示哪些具体的聚类组

总结

正确理解Scanpy函数参数的含义对于数据分析至关重要。rank_genes_groups可视化函数中的groups参数需要传入具体的聚类组名称，而不是聚类方法的名称。掌握这一区别可以避免常见的错误，使单细胞数据分析流程更加顺畅。

登录后查看全文

Scanpy中rank_genes_groups绘图函数的使用注意事项

问题背景

正确使用方法

参数解析

常见误区

总结

项目优选