SpaceXR 空间转录组学分析工具安装与使用指南
2026-02-06 04:39:06作者:劳婵绚Shirley
项目介绍
SpaceXR(Spatial-eXpression-R)是一个用于空间转录组学数据分析的开源 R 包,主要功能包括细胞类型识别(包括细胞类型混合)和细胞类型特异性差异表达分析。该项目由 Dylan Cable 开发,旨在为研究人员提供强大的工具来解析空间转录组学数据。
SpaceXR 包含两个核心组件:
- RCTD(Robust Cell Type Decomposition):从单细胞RNA测序数据中学习细胞类型特征,并在空间转录组数据中识别细胞类型
- C-SIDE(Cell type-Specific Inference of Differential Expression):检测细胞类型特异性差异表达,分析空间位置、细胞微环境等因素对基因表达的影响
环境要求
在安装 SpaceXR 之前,请确保系统满足以下要求:
- 操作系统:Linux、macOS 或 Windows
- R 版本:R 3.5.0 或更高版本
- 内存:建议至少 4GB RAM
- 处理器:多核处理器可显著提高运行速度
依赖包安装
首先需要安装必要的 R 依赖包:
# 安装 CRAN 依赖包
install.packages(c("devtools", "readr", "ggplot2", "pals", "Matrix",
"parallel", "doParallel", "foreach", "quadprog",
"tibble", "dplyr", "reshape2", "knitr", "rmarkdown",
"fields", "mgcv", "CompQuadForm", "Rfast", "locfdr",
"metafor", "data.table"))
# 设置超时时间避免下载超时
options(timeout = 600)
项目安装方式
方法一:从 GitCode 安装(推荐)
# 克隆项目仓库
git clone https://gitcode.com/gh_mirrors/sp/spacexr.git
然后在 R 中安装:
# 从本地目录安装
devtools::install_local("spacexr", build_vignettes = FALSE)
方法二:直接从 GitHub 安装
# 安装开发工具包
if (!requireNamespace("devtools", quietly = TRUE)) {
install.packages("devtools")
}
# 安装 SpaceXR 包
devtools::install_github("dmcable/spacexr", build_vignettes = FALSE)
如果需要构建教程文档(需要较长时间),可以将 build_vignettes 参数设置为 TRUE。
快速开始指南
1. 加载 SpaceXR 包
library(spacexr)
2. 数据准备
首先需要准备空间转录组数据和单细胞参考数据:
# 创建 SpatialRNA 对象(空间转录组数据)
puck <- SpatialRNA(coords, counts, nUMI)
# 创建 Reference 对象(单细胞参考数据)
reference <- Reference(cell_types, counts, nUMI)
3. 运行 RCTD 进行细胞类型识别
# 创建 RCTD 对象
myRCTD <- create.RCTD(puck, reference, max_cores = 4, test_mode = FALSE)
# 运行 RCTD 分析
myRCTD <- run.RCTD(myRCTD, doublet_mode = 'doublet')
4. 运行 C-SIDE 进行差异表达分析
# 定义协变量(如空间位置)
covariate <- puck@coords$x # 示例:使用 x 坐标作为协变量
# 运行 C-SIDE 分析
myRCTD <- run.CSIDE.single(myRCTD, covariate, cell_types = NULL)
5. 结果可视化
# 绘制细胞类型分布图
plot_weights(myRCTD)
# 绘制差异表达结果
make_all_de_plots(myRCTD)
项目文件结构
SpaceXR 项目包含以下主要目录:
- R/:包含主要的 R 源代码文件
- vignettes/:包含教程文档和示例代码
- inst/extdata/:包含示例数据文件
- AnalysisPaper/:包含论文分析代码
- AnalysisCSIDE/:包含 C-SIDE 分析代码
示例数据
项目提供了多个示例数据集,位于 inst/extdata/ 目录下:
- MerfishVignette/:MERFISH 数据示例
- Vignette/:基本教程数据
- VisiumVignette/:Visium 数据示例
常见问题解决
安装超时问题
如果安装过程中出现超时错误,可以增加超时时间:
options(timeout = 600) # 设置10分钟超时
内存不足问题
对于大型数据集,可能需要增加内存分配:
# 在运行前清理内存
gc()
# 使用较少的核心数以减少内存使用
myRCTD <- create.RCTD(puck, reference, max_cores = 2, test_mode = FALSE)
依赖包冲突
如果遇到包冲突,可以尝试更新所有包:
update.packages(ask = FALSE, checkBuilt = TRUE)
性能优化建议
- 使用多核处理:设置
max_cores参数利用多核处理器 - 预处理数据:在运行前过滤低表达基因和细胞
- 分批处理:对于特大数据集,考虑分批处理
- 监控内存使用:定期使用
gc()清理内存
文档资源
- 项目手册:spacexr_manual_2.2.1.pdf
- 教程文档:vignettes/ 目录下的 Rmd 文件
- 示例代码:AnalysisPaper/ 和 AnalysisCSIDE/ 目录
通过以上步骤,您可以成功安装并使用 SpaceXR 进行空间转录组学数据分析。建议先从提供的示例数据开始,熟悉工作流程后再应用到自己的研究数据中。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0155- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
LongCat-Video-Avatar-1.5最新开源LongCat-Video-Avatar 1.5 版本,这是一款经过升级的开源框架,专注于音频驱动人物视频生成的极致实证优化与生产级就绪能力。该版本在 LongCat-Video 基础模型之上构建,可生成高度稳定的商用级虚拟人视频,支持音频-文本转视频(AT2V)、音频-文本-图像转视频(ATI2V)以及视频续播等原生任务,并能无缝兼容单流与多流音频输入。00
auto-devAutoDev 是一个 AI 驱动的辅助编程插件。AutoDev 支持一键生成测试、代码、提交信息等,还能够与您的需求管理系统(例如Jira、Trello、Github Issue 等)直接对接。 在IDE 中,您只需简单点击,AutoDev 会根据您的需求自动为您生成代码。Kotlin03
Intern-S2-PreviewIntern-S2-Preview,这是一款高效的350亿参数科学多模态基础模型。除了常规的参数与数据规模扩展外,Intern-S2-Preview探索了任务扩展:通过提升科学任务的难度、多样性与覆盖范围,进一步释放模型能力。Python00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0112
项目优选
收起
暂无描述
Dockerfile
733
4.76 K
deepin linux kernel
C
31
16
Ascend Extension for PyTorch
Python
652
797
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
1.25 K
155
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.1 K
611
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.01 K
1.01 K
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
147
237
昇腾LLM分布式训练框架
Python
168
200
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
434
395
暂无简介
Dart
987
253