DeepVariant项目中BQSR样本处理参数的正确配置方法

2025-06-24 08:38:41作者：盛欣凯Ernestine

DeepVariant is an analysis pipeline that uses a deep neural network to call genetic variants from next-generation DNA sequencing data.

项目地址：https://gitcode.com/gh_mirrors/de/deepvariant

在基因组数据分析领域，Google开发的DeepVariant软件因其高精度的变异检测能力而广受关注。本文针对用户在使用DeepVariant处理经过BQSR（Base Quality Score Recalibration）的样本时遇到的参数配置问题进行技术解析。

问题背景

当用户尝试使用DeepVariant分析经过BQSR处理的样本时，需要启用两个关键参数：

parse_sam_aux_fields：用于解析SAM/BAM/CRAM文件中的辅助字段
use_original_quality_scores：使用原始质量分数而非重新校准后的分数

常见错误配置

用户经常犯的错误是将这些参数错误地添加到了call_variants_extra_args参数中，导致程序报出"Unknown command line flag"的错误。这是因为这些参数实际上属于make_examples阶段，而非call_variants阶段。

正确配置方法

正确的参数配置应该如下所示：

/opt/deepvariant/bin/run_deepvariant \
    --ref=genome.fasta \
    --reads=test.paired_end.sorted.cram \
    --output_vcf=test.deepvariant.vcf.gz \
    --output_gvcf=test.deepvariant.g.vcf.gz \
    --model_type=WES \
    --make_examples_extra_args 'parse_sam_aux_fields=true,use_original_quality_scores=true' \
    --intermediate_results_dir=tmp \
    --num_shards=4

技术原理

parse_sam_aux_fields：这个参数指示DeepVariant读取比对文件中的OQ（Original Quality）标签，该标签存储了BQSR前的原始质量分数。
use_original_quality_scores：当启用此参数时，DeepVariant会使用原始质量分数而非重新校准后的分数进行变异检测，这对于保持数据一致性非常重要。

最佳实践建议

对于BQSR处理过的样本，建议始终启用这两个参数
确保参数添加到正确的阶段（make_examples阶段）
参数值应设置为true，且不需要前导的--
多个参数之间用逗号分隔，不要有空格

总结

正确配置DeepVariant参数对于获得准确的变异检测结果至关重要。通过理解不同处理阶段的功能划分和参数作用域，可以避免常见的配置错误，确保分析流程的顺利运行。对于BQSR样本，特别要注意将相关参数正确添加到make_examples阶段，才能充分利用原始质量分数信息。

DeepVariant is an analysis pipeline that uses a deep neural network to call genetic variants from next-generation DNA sequencing data.

项目地址：https://gitcode.com/gh_mirrors/de/deepvariant

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理