vg团队发布vg 1.63.0版本：基因组变异图工具的重大更新

2025-07-04 06:56:12作者：尤辰城Agatha

tools for working with genome variation graphs

项目地址：https://gitcode.com/gh_mirrors/vg1/vg

vg（variation graph）是一个用于构建、操作和分析基因组变异图的强大工具集。基因组变异图是一种能够同时表示多个基因组序列及其变异的图结构，在基因组学研究中具有重要价值。vg工具集由加州大学圣克鲁兹分校基因组学研究所开发，广泛应用于基因组组装、比对和变异检测等领域。

近日，vg团队正式发布了1.63.0版本，代号"Boccaleone"。这个版本带来了多项重要改进和新功能，特别是在长读长比对和数据处理效率方面有显著提升。下面我们将详细介绍这个版本的主要更新内容。

核心功能增强

本次更新最引人注目的是长读长Giraffe功能的引入。Giraffe是vg中的高效比对工具，此前主要针对短读长测序数据。在1.63.0版本中，Giraffe现在可以处理长读长数据，新增了两个参数预设选项：--parameter-preset hifi用于HiFi长读长数据，--parameter-preset r10用于Oxford Nanopore R10长读长数据。这些新选项采用基于链式的新算法，显著提高了长读长比对的准确性。

同时，Giraffe的索引格式也进行了更新，新增了.zipcodes索引文件，改进了距离索引格式，这些变化使得比对过程更加高效。值得注意的是，minimizer文件格式已经改变，用户需要重新生成相关索引文件。

性能优化与改进

在性能方面，1.63.0版本有多项优化：

GAF排序工具vg gamsort现在运行速度大幅提升，能够更快地处理比对结果文件。
单倍型信息文件现在体积更小，减少了存储空间占用，同时保持向后兼容性。
vg现在能够智能识别Slurm作业环境中的CPU资源，通过SLURM_JOB_CPUS_PER_NODE和CPU亲和性掩码自动调整线程数，提高资源利用率。

工具功能增强

多个子工具获得了功能增强：

vg view工具现在能更好地处理不同类型的JSON输入，提供了更清晰的文档说明。
vg filter工具新增了输出identity字段到TSV文件的功能，便于后续分析。
vg inject工具增加了--add-identity选项，可以为线性比对器输出的BAM文件计算identity统计量。
vg chunk工具现在能正确处理已有子范围定义的路径片段。
新增vg primers工具，用于从primer3获取PCR引物中的变异统计信息。

算法改进

identity计算算法进行了重要调整，不再将软剪裁（路径开始/结束处的插入）计入总长度惩罚。这一变化影响了GAM文件中identity字段的计算方式，用户需要注意这一行为变更可能对现有分析流程的影响。

用户体验改进

在用户体验方面，1.63.0版本也做了多项改进：

新增了man手册页，用户可以通过make doc/man/vg.1生成，方便查阅命令行帮助。
vg rna工具现在对.gz输入文件会给出更有用的错误提示。
giraffe-facts.py脚本现在可以直接读取GAM文件，不再需要JSON预处理步骤。
vg autoindex工具不再重复输入gbz文件作为.giraffe.gbz输出。

总结

vg 1.63.0版本在长读长比对支持、性能优化和用户体验方面都有显著提升，特别是Giraffe对长读长数据的支持为使用PacBio HiFi或Oxford Nanopore数据的用户提供了新的分析选择。这些改进使得vg在基因组变异图分析领域的应用更加广泛和高效。

对于现有用户，升级到这个版本需要注意minimizer文件格式的变化以及identity计算方式的调整。新用户可以借助改进的文档和错误提示更快上手这个强大的基因组分析工具集。

tools for working with genome variation graphs

项目地址：https://gitcode.com/gh_mirrors/vg1/vg

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

deepin linux kernel

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

MindQuantum is a general software library supporting the development of applications for quantum computation.

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！