DeepVariant项目Deeptrio组件权限问题分析与解决方案

2025-06-24 12:51:17作者：蔡怀权

问题背景

在DeepVariant项目的Deeptrio组件v1.9.0版本中，用户在使用Docker容器运行时遇到了一个关键性的权限问题。当尝试运行deeptrio的make_examples阶段时，系统会抛出PermissionDeniedError，提示无法访问/opt/smallmodels/deeptrio/wgs/child/saved_model.pb文件。

技术分析

这个问题源于Docker容器构建过程中的权限设置不完整。在v1.9.0版本的Dockerfile中，虽然添加了smallmodels目录，但未对该目录下的文件设置适当的读取权限。与项目中其他模型目录不同，smallmodels目录缺少了必要的chmod +r权限设置。

具体表现为：

当用户以非root用户身份运行容器时（通过--user $(i d - u) :$ (id -g)参数）
系统尝试加载小型模型进行推理时
由于权限不足，TensorFlow无法读取saved_model.pb文件

影响范围

该问题会影响以下使用场景：

使用Deeptrio v1.9.0版本
在Ubuntu等Linux系统上运行
以非root用户身份运行Docker容器
使用WGS模型类型进行分析

解决方案

项目维护者迅速响应并提供了官方修复方案。解决方案包括两个关键步骤：

在Dockerfile中添加权限设置命令：

RUN chmod -R +r /opt/smallmodels/deeptrio/wgs/child/*

重新构建并发布了官方Docker镜像：

CPU版本：google/deepvariant:deeptrio-1.9.0
GPU版本：google/deepvariant:deeptrio-1.9.0-gpu

验证与测试

用户可以通过以下方式验证修复效果：

拉取最新官方镜像
使用测试数据集运行标准分析流程
确认make_examples阶段能够正常完成

测试命令示例：

docker run --user $(id -u):$(id -g) \
  -v "${WORK_DIR}":"/data" \
  google/deepvariant:deeptrio-1.9.0 \
  /opt/deepvariant/bin/deeptrio/run_deeptrio \
  --model_type=WGS \
  --ref=/data/GRCh38_no_alt_analysis_set.fasta \
  --reads_child=/data/HG002.chr20.10_10p1mb.bam \
  --reads_parent1=/data/HG003.chr20.10_10p1mb.bam \
  --reads_parent2=/data/HG004.chr20.10_10p1mb.bam \
  --output_vcf_child /data/HG002.output.vcf.gz \
  --num_shards 8 \
  --regions "chr20:10,000,000-10,010,000"