首页
/ SigProfilerMatrixGenerator 开源项目教程

SigProfilerMatrixGenerator 开源项目教程

2025-05-20 11:03:48作者:史锋燃Gardner

1. 项目介绍

SigProfilerMatrixGenerator 是一个用于生成各种体细胞突变类型的突变矩阵的工具。它能够将生成的突变仅限于基因组的一部分(例如外显子或自定义的 BED 文件)。该工具能够与 SigProfiler 工具套件无缝集成,为研究人员提供了一个强大的分析平台。

2. 项目快速启动

安装

首先,确保您的系统中已安装 Python 3.8 或更高版本。然后,使用 pip 命令安装 SigProfilerMatrixGenerator:

pip install SigProfilerMatrixGenerator

接下来,安装您所需的参考基因组。以下命令将安装人类 37 版本的基因组:

from SigProfilerMatrixGenerator import install as genInstall
genInstall.install('GRCh37', rsync=False, bash=True)

使用

将您的 VCF 文件放置在您选择的输出文件夹中。在 Python 会话中,您现在可以生成突变矩阵:

from SigProfilerMatrixGenerator.scripts import SigProfilerMatrixGeneratorFunc as matGen

matrices = matGen.SigProfilerMatrixGeneratorFunc(
    "test_project",
    "GRCh37",
    "/path/to/your/output/folder",
    plot=True,
    exome=False,
    bed_file=None,
    chrom_based=False,
    tsb_stat=False,
    seqInfo=True,
    cushion=100
)

参数说明

  • project:项目名称。
  • reference_genome:参考基因组名称。
  • path_to_input_files:输入文件的路径。

可选参数包括 exomebed_filechrom_basedplottsb_statseqInfocushion,它们分别控制不同的功能和行为。

3. 应用案例和最佳实践

案例一:外显子区域突变矩阵的生成

如果您想针对外显子区域生成突变矩阵,可以在调用 SigProfilerMatrixGeneratorFunc 时设置 exome=True 参数。

最佳实践

  • 在生成突变矩阵之前,确保所有输入文件格式正确,并且每个样本的 VCF 文件是独立的。
  • 使用 plot=True 参数来生成可视化结果,这有助于更直观地理解数据。
  • 在分析过程中记录日志,以便于后续的问题追踪和数据验证。

4. 典型生态项目

SigProfilerMatrixGenerator 是 SigProfiler 工具套件的一部分,该套件还包括其他用于突变分析和可视化的工具。通过这些工具的相互配合,研究人员可以更全面地分析体细胞突变数据。

登录后查看全文
热门项目推荐