DeepVariant运行中postprocess_variants步骤找不到VCF文件的解决方案

2025-06-24 22:39:00作者：翟萌耘Ralph

在使用DeepVariant进行变异检测分析时，用户可能会遇到postprocess_variants步骤无法找到输出VCF文件的问题。本文将从技术角度分析该问题的原因并提供解决方案。

问题现象

当运行DeepVariant的完整流程时，call_variants步骤能够顺利完成，但在postprocess_variants步骤会出现如下错误：

[E::hts_open_format] Failed to open file "/path/to/output.vcf.gz" : No such file or directory
Could not open variants_path: /path/to/output.vcf.gz

根本原因分析

经过技术分析，该问题通常由以下几个原因导致：

输出目录不存在：DeepVariant不会自动创建输出目录，如果指定的输出目录路径不存在，会导致写入失败。
权限问题：运行DeepVariant的用户可能没有在目标目录创建文件的权限。
路径解析问题：在使用容器环境时，容器内外路径映射可能导致路径解析错误。

解决方案

1. 确保输出目录存在

在执行DeepVariant前，手动创建输出目录：

mkdir -p ${VCF_DIR}/${SAMPLE}/

2. 检查目录权限

确认运行用户对输出目录有写入权限：

ls -ld ${VCF_DIR}/${SAMPLE}/

如有必要，可修改目录权限：

chmod 755 ${VCF_DIR}/${SAMPLE}/

3. 容器环境路径处理

使用Singularity容器时，确保：

主机路径已正确挂载到容器内
路径在容器内外一致
避免使用相对路径

4. 完整命令示例

修正后的完整运行命令应包含目录创建步骤：

# 创建输出目录
mkdir -p ${VCF_DIR}/${SAMPLE}/
mkdir -p /public1/home/yinhang/data/tmp/${SAMPLE}/

# 运行DeepVariant
singularity exec /path/to/deepvariant-1.6.0.sif \
/opt/deepvariant/bin/run_deepvariant \
--model_type=WGS \
--ref=${ref_genome} \
--reads="${SORTED_BAM_DIR}/${SAMPLE}/${SAMPLE}.sorted.bam" \
--output_vcf="${VCF_DIR}/${SAMPLE}/${SAMPLE}.vcf.gz" \
--output_gvcf="${VCF_DIR}/${SAMPLE}/${SAMPLE}.g.vcf.gz" \
--intermediate_results_dir=/public1/home/yinhang/data/tmp/${SAMPLE}/ \
--num_shards=60 \
--sample_name ${SAMPLE}