Scanpy项目中对Visium多组学数据读取功能的演进

2025-07-04 10:21:36作者：裴麒琰

在单细胞和空间转录组分析领域，Scanpy作为Python生态中的核心工具包，其数据处理能力直接影响着科研工作的效率。近期关于Visium多组学数据（特别是蛋白表达数据）读取功能的讨论，反映了当前生物信息学工具需要适应快速发展的多模态测序技术。

背景与现状

传统Visium技术主要提供空间转录组数据，但随着CytAssist Visium等新技术的发展，现在可以同时获取蛋白质表达数据（通过抗体捕获技术）和基因表达数据。这种多模态数据为研究提供了更全面的视角，但也对分析工具提出了新的要求。

Scanpy原有的read_visium()函数设计主要针对基因表达数据，其核心参数gex_only默认为True，这意味着默认情况下会过滤掉非基因表达特征。虽然可以通过设置gex_only=False来保留所有特征，但函数并未针对多模态数据做特别优化。

技术挑战

多组学Visium数据的主要技术挑战包括：

数据整合问题：需要同时处理来自不同技术平台（RNA-seq和抗体捕获）的数据
特征类型标识：需要清晰区分基因表达特征和蛋白表达特征
数据分析流程：不同模态的数据可能需要不同的预处理和分析方法

解决方案演进

Scanpy团队已经意识到这一问题，并在近期版本中做出了重要调整。从Scanpy 1.11.0版本开始，团队决定将Visium数据相关的功能迁移至Squidpy项目，这一专门处理空间组学数据的工具包。

这种功能迁移有几个重要优势：

专业化分工：Squidpy可以更专注于空间组学数据的各种特殊需求
功能扩展性：更容易添加对新型数据格式和多模态数据的支持
维护效率：专门的团队可以更快响应空间组学领域的新需求

迁移对应关系

Scanpy中原有的Visium相关功能在Squidpy中有以下对应实现：

数据读取：scanpy.read_visium() → squidpy.read.visium()
示例数据：scanpy.datasets.visium_sge() → squidpy.datasets.visium()
可视化：scanpy.pl.spatial() → squidpy.pl.spatial_scatter()

对用户的建议

对于需要使用Visium多组学数据的用户，建议：

升级到最新版Scanpy和Squidpy
使用Squidpy的数据读取函数处理多模态Visium数据
注意检查特征类型标识（feature_types），合理区分不同模态的数据
针对不同模态数据采用适当的预处理方法

这种功能迁移反映了生物信息学工具生态的健康发展，通过专业化分工为用户提供更好的分析体验。随着空间多组学技术的普及，这种架构将能更好地支持复杂的数据分析需求。

scanpy

Single-cell analysis in Python. Scales to >100M cells.

项目地址：https://gitcode.com/gh_mirrors/sc/scanpy

登录后查看全文

项目优选

收起

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

455

438

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

454

5.07 K

Scanpy项目中对Visium多组学数据读取功能的演进

背景与现状

技术挑战

解决方案演进

迁移对应关系

对用户的建议

热门内容推荐

最新内容推荐

项目优选

Scanpy项目中对Visium多组学数据读取功能的演进

背景与现状

技术挑战

解决方案演进

迁移对应关系

对用户的建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选