首页
/ pyGenomeViz 项目教程

pyGenomeViz 项目教程

2024-09-14 14:46:13作者:江焘钦

1. 项目介绍

pyGenomeViz 是一个基于 matplotlib 的基因组可视化 Python 包,专为比较基因组学设计。该包旨在轻松且美观地绘制基因组特征和多个基因组之间的序列相似性比较链接。它支持从 Genbank/GFF 格式文件中提取基因组信息,并可以将图表保存为多种格式(JPG/PNG/SVG/PDF/HTML)。用户可以在 Jupyter Notebook 中进行交互式基因组可视化,或在基因组分析脚本/工作流中自动生成基因组可视化图表。

2. 项目快速启动

安装

首先,确保你已经安装了 Python 3.8 或更高版本。然后,你可以通过以下命令安装 pyGenomeViz

pip install pygenomeviz

或者通过 conda 安装:

conda install -c conda-forge pygenomeviz

快速示例

以下是一个简单的示例,展示如何使用 pyGenomeViz 绘制基因组特征:

from pygenomeviz import GenomeViz

# 创建 GenomeViz 实例
gv = GenomeViz()

# 添加特征轨道
track = gv.add_feature_track("tutorial", 1000)

# 添加子标签
track.add_sublabel()

# 添加特征
track.add_feature(50, 200, 1)
track.add_feature(250, 460, -1, fc="blue")
track.add_feature(500, 710, 1, fc="lime")
track.add_feature(750, 960, 1, fc="magenta", lw=1.0)

# 保存图表
gv.savefig("features.png")

3. 应用案例和最佳实践

应用案例

基因组比较

pyGenomeViz 可以用于比较多个基因组,展示它们之间的相似性和差异。以下是一个示例代码:

from pygenomeviz import GenomeViz

genome_list = [
    {"name": "genome 01", "size": 1000, "features": ((150, 300, 1), (500, 700, -1), (750, 950, 1))},
    {"name": "genome 02", "size": 1300, "features": ((50, 200, 1), (350, 450, 1), (700, 900, -1), (950, 1150, -1))},
    {"name": "genome 03", "size": 1200, "features": ((150, 300, 1), (350, 450, -1), (500, 700, -1), (700, 900, -1))},
]

gv = GenomeViz(track_align_type="center")
gv.set_scale_bar()

for genome in genome_list:
    name, size, features = genome["name"], genome["size"], genome["features"]
    track = gv.add_feature_track(name, size)
    track.add_sublabel()
    for idx, feature in enumerate(features, 1):
        start, end, strand = feature
        track.add_feature(start, end, strand, plotstyle="bigarrow", lw=1, label=f"gene{idx:02d}", text_kws=dict(rotation=0, vpos="top", hpos="center"))

# 添加链接
gv.add_link(("genome 01", 150, 300), ("genome 02", 50, 200))
gv.add_link(("genome 01", 700, 500), ("genome 02", 900, 700))
gv.add_link(("genome 01", 750, 950), ("genome 02", 1150, 950))

gv.savefig("tracks_and_links.png")

最佳实践

  • 使用 Jupyter Notebook:在 Jupyter Notebook 中使用 pyGenomeViz 可以方便地进行交互式基因组可视化。
  • 自动化工作流:将 pyGenomeViz 集成到基因组分析脚本或工作流中,自动生成可视化图表。
  • 保存为多种格式:根据需要将图表保存为 JPG、PNG、SVG、PDF 或 HTML 格式。

4. 典型生态项目

pyGenomeViz 可以与其他基因组分析工具和库结合使用,例如:

  • BioPython:用于基因组数据的解析和处理。
  • matplotlib:用于自定义图表的样式和布局。
  • pandas:用于数据处理和分析。

通过这些工具的结合,可以构建更复杂的基因组分析和可视化工作流。

登录后查看全文
热门项目推荐