如何快速掌握rmats2sashimiplot：RNA-seq可变剪接可视化的完整指南 🧬

2026-02-05 04:02:42作者：羿妍玫Ivan

rmats2sashimiplot是一款强大的RNA-seq数据可视化工具，专为展示可变剪接事件设计。它基于Sashimi plot概念，通过计算平均读深度和跨接合点读数，帮助研究人员直观理解基因表达和剪接变异。作为rMATS工具的配套可视化模块，它能无缝衔接上游分析结果，提供 publication 级别的高质量图表。

📋 核心功能与依赖准备

✨ 为什么选择rmats2sashimiplot？

一站式可视化：直接读取rMATS输出文件或BAM/SAM格式的测序数据
灵活分组比较：支持多组样本同时展示，轻松比较不同实验条件
** publication 级图表**：可定制的图形参数满足科研论文发表需求
两种输入模式：既支持rMATS事件文件，也支持自定义基因组区域

🛠️ 环境依赖清单

Python 2.7（Python 3用户需先运行2to3.sh转换脚本）
核心依赖库：numpy、scipy、matplotlib、pysam
第三方工具：Samtools、bedtools
兼容系统：所有Unix-based环境（Linux/macOS）

🚀 快速安装指南

🌟 方法一：直接运行（免安装）

python ./src/rmats2sashimiplot/rmats2sashimiplot.py

🌟 方法二：系统安装（推荐）

# 克隆项目仓库
git clone https://gitcode.com/gh_mirrors/rm/rmats2sashimiplot
cd rmats2sashimiplot

# 安装到系统环境
python ./setup.py install

# 验证安装
rmats2sashimiplot --help

🔄 更新方法

pip uninstall rmats2sashimiplot
python ./setup.py install

📊 三种核心使用场景详解

场景1️⃣：使用rMATS事件文件可视化

当您已经通过rMATS完成可变剪接事件分析后，可直接使用其输出文件进行可视化：

rmats2sashimiplot \
  --s1 sample1_reps.txt \
  --s2 sample2_reps.txt \
  --event-type SE \
  -e SE.MATS.JC.txt \
  --l1 Control --l2 Treatment \
  --exon_s 1 --intron_s 5 \
  -o se_sashimi_output

其中sample1_reps.txt文件格式：

./rep1.sam,./rep2.sam,./rep3.sam

运行后将生成包含剪接事件的可视化结果：

图1：使用rMATS事件文件生成的Sashimi图，展示了不同样本间的剪接差异

场景2️⃣：指定基因组区域可视化

直接通过基因组坐标和GFF3注释文件绘制特定区域的剪接模式：

rmats2sashimiplot \
  --b1 sample1_bams.txt \
  --b2 sample2_bams.txt \
  -c chr16:+:9000:25000:annotation.gff3 \
  --l1 Control --l2 Treatment \
  --exon_s 1 --intron_s 5 \
  -o coordinate_sashimi_output

生成基于坐标的可视化结果：

图2：基于基因组坐标和GFF3注释生成的Sashimi图

场景3️⃣：多组样本比较（高级功能）

通过分组文件实现更复杂的样本比较，例如将生物学重复合并展示：

rmats2sashimiplot \
  --b1 all_samples.bam \
  --event-type SE \
  -e SE.MATS.JC.txt \
  --l1 Control --l2 Treatment \
  --exon_s 1 --intron_s 5 \
  -o grouped_sashimi_output \
  --group-info grouping.gf

分组文件grouping.gf格式：

Young: 1-3
Old: 4-6

多组比较可视化结果：

图3：使用分组文件比较不同年龄组的剪接模式差异

🧮 结果解读与参数优化

📈 Y轴数值含义

Sashimi图的Y轴表示经过修正的RPKM值，计算方式如下：

图4：Y轴数值（修正RPKM）的计算原理示意图

每个测序 reads 的计数会均匀分配到其覆盖的基因组位置，然后通过总 reads 数和两个常数（1,000和1,000,000）进行标准化。

⚙️ 常用参数调整

图形尺寸：--fig-height 10 --fig-width 12（默认高度7英寸，宽度8英寸）
颜色定制：--color "#3498db,#e74c3c"（指定样本颜色）
字体大小：--font-size 10（默认8）
剪接强度阈值：--min-counts 5（过滤低表达的剪接事件）
显示优化：--hide-number（隐藏连接线上的读数）

📂 输出文件结构

所有结果保存在-o参数指定的目录中：

Sashimi_index/：中间索引文件
Sashimi_plot/：最终生成的PDF格式图表
Sashimi_index_{Gene}_{event_id}/：每个事件的独立索引目录

💡 实用技巧与常见问题

🔍 加速运行的小窍门

过滤事件文件：仅保留感兴趣的事件，减少处理量
并行处理：对不同事件文件同时运行多个rmats2sashimiplot实例
预索引BAM：确保BAM文件已建立索引（.bai文件）

❓ 常见问题解答

Q: 为什么我的图表中没有显示某些连接线？
A: 可能是由于读数低于阈值，可尝试降低--min-counts参数值（默认0）

Q: 如何解决染色体名称不匹配的问题？
A: 使用--remove-event-chr-prefix参数移除事件文件中的"chr"前缀，或--keep-event-chr-prefix强制保留

Q: 可以使用GTF格式的注释文件吗？
A: 不可以，需要先转换为GFF3格式，推荐使用gffread工具：

gffread --keep-genes input.gtf -o output.gff3

📚 完整参数列表

rmats2sashimiplot --help

核心参数速查：

参数类别	关键参数	说明
输入控制	`-e/--event-type`	rMATS事件文件及类型
	`-c`	基因组坐标和GFF3文件
数据来源	`--b1/--b2`	BAM文件列表
	`--s1/--s2`	SAM文件列表
输出设置	`-o`	输出目录（必填）
	`--l1/--l2`	样本组标签
图形定制	`--exon_s/--intron_s`	外显子/内含子缩放比例
	`--color`	自定义颜色方案
高级功能	`--group-info`	样本分组文件
	`--min-counts`	最小连接读数阈值

🎯 最佳实践案例

案例：差异剪接事件验证

当通过rMATS检测到显著差异的剪接事件后，使用以下命令生成高质量可视化图表：

rmats2sashimiplot \
  --b1 control_rep1.bam,control_rep2.bam \
  --b2 treated_rep1.bam,treated_rep2.bam \
  --event-type SE \
  -e SE.MATS.JC.txt \
  --l1 Control --l2 Treated \
  --exon_s 1 --intron_s 5 \
  --color "#2ecc71,#e74c3c" \
  --fig-height 8 --fig-width 10 \
  -o se_validation_plots

此命令将为SE事件文件中的每个剪接事件生成独立的PDF图表，可直接用于论文发表。