Scanpy项目中的Visium HD空间转录组数据支持方案

2025-07-04 08:12:50作者：滑思眉Philip

随着10X Genomics公司Space Ranger软件升级至v3.0版本，其输出文件格式发生了显著变化，导致Scanpy等分析工具无法直接读取这些新格式的数据。本文将详细介绍如何在Scanpy生态系统中处理Visium HD空间转录组数据。

背景与挑战

Visium HD是10X Genomics推出的新一代空间转录组技术，能够提供更高分辨率的基因表达空间信息。随着Space Ranger v3.0的发布，数据输出格式进行了重大调整，与v2.0版本不兼容，这给使用Scanpy进行分析的研究人员带来了困扰。

解决方案：spatialdata-io工具包

scverse社区已经开发了专门的解决方案——spatialdata-io工具包，其中包含了对Visium HD数据的读取支持。该工具包能够解析Space Ranger v3.0输出的原生格式数据（包含多种文件类型，但不限于Zarr格式）。

核心功能实现

spatialdata-io中的visium_hd函数专门用于读取Visium HD数据，其特点包括：

支持多注释表处理（Visium HD和MCMICRO是目前唯一使用多表的技术）
返回SpatialData对象，可直接转换为AnnData对象供Scanpy使用
保留完整的空间信息

实际应用示例

研究人员可以按照以下流程处理Visium HD数据：

使用spatialdata_io.visium_hd读取原始数据
将返回的SpatialData对象转换为AnnData格式
直接在Scanpy中进行预处理、质量控制和聚类分析

对于需要保存中间结果的场景，可以将SpatialData对象保存为Zarr格式，后续使用spatialdata.read_zarr重新读取，无需再次依赖spatialdata_io包。

注意事项

在实际使用中可能会遇到一些问题，例如：

dataset_id参数问题：当无法从特征切片文件自动推断dataset_id时，需要手动指定
文件路径问题：确保输入路径包含完整的Space Ranger输出目录
版本兼容性：确认使用的spatialdata-io版本支持特定的Space Ranger输出格式

未来发展方向

随着空间组学技术的快速发展，Scanpy生态系统正在将空间数据分析功能迁移到专门的工具包中。spatialdata-io作为这一生态的重要组成部分，将持续更新以支持最新的数据格式和分析需求。研究人员可以关注该项目的更新，获取对新兴技术的支持。

对于希望继续使用Scanpy进行分析的用户，建议将空间数据处理流程与单细胞分析流程分离，通过中间格式实现数据交换，既保证了分析的灵活性，又能充分利用各专业工具的优势。

scanpy

Single-cell analysis in Python. Scales to >100M cells.

项目地址：https://gitcode.com/gh_mirrors/sc/scanpy

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

491

512

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

635

255