ichorCNA：超低覆盖率WGS数据中肿瘤细胞比例估算工具

2024-09-25 14:55:53作者：曹令琨Iris

项目介绍

ichorCNA 是一款用于从超低覆盖率全基因组测序（ULP-WGS，0.1x 覆盖率）数据中估算肿瘤细胞比例的工具。该工具通过概率模型，特别是隐马尔可夫模型（HMM），能够同时对基因组进行分段、预测大规模拷贝数变异，并估算肿瘤细胞在超低覆盖率全基因组测序样本中的比例。ichorCNA 由 Broad Institute 开发和维护，其方法论和概率模型已在 Nature Communications 上发表，并得到了广泛认可。

项目技术分析

ichorCNA 的核心技术基于隐马尔可夫模型（HMM），这是一种强大的统计模型，能够处理序列数据中的复杂模式。具体来说，ichorCNA 通过以下两个主要任务实现其功能：

GC 含量偏差校正：使用 HMMcopy 进行 GC 含量偏差校正，包括计算 ULP-WGS 的读取覆盖率，并对数据进行校正和归一化。
拷贝数变异预测和肿瘤细胞比例估算：通过 HMM 模型，ichorCNA 能够预测大规模拷贝数变异，并估算肿瘤细胞在 cfDNA 中的比例。

项目及技术应用场景

ichorCNA 主要应用于以下场景：

肿瘤研究：在肿瘤研究中，估算肿瘤细胞比例对于理解肿瘤的异质性和进展至关重要。ichorCNA 能够从超低覆盖率的全基因组测序数据中提取有价值的信息，帮助研究人员更好地理解肿瘤的生物学特性。
液体活检：在液体活检中，cfDNA 是一种重要的生物标志物。ichorCNA 能够从 cfDNA 中准确估算肿瘤细胞比例，为液体活检提供了强大的分析工具。
临床诊断：在临床诊断中，准确估算肿瘤细胞比例可以帮助医生制定更精准的治疗方案，提高治疗效果。

项目特点

ichorCNA 具有以下显著特点：

高精度：基于隐马尔可夫模型的概率模型，ichorCNA 能够提供高精度的拷贝数变异预测和肿瘤细胞比例估算。
可扩展性：ichorCNA 的设计考虑了大规模数据处理的需求，能够处理超低覆盖率的全基因组测序数据，适用于大规模的肿瘤研究项目。
易用性：ichorCNA 提供了详细的 Wiki 页面，涵盖了使用指南、输出解释和常见问题解答，方便用户快速上手。
开源免费：ichorCNA 采用 GNU General Public License 开源协议，用户可以自由使用、修改和分发该工具。

结语

ichorCNA 作为一款强大的肿瘤细胞比例估算工具，已经在多个研究项目中得到了验证和应用。无论是在肿瘤研究、液体活检还是临床诊断中，ichorCNA 都能提供高精度的分析结果，帮助研究人员和临床医生更好地理解肿瘤的生物学特性，制定更精准的治疗方案。如果您正在寻找一款高效、易用的肿瘤细胞比例估算工具，ichorCNA 将是您的理想选择。

了解更多信息，请访问 ichorCNA GitHub Wiki 页面。

ichorCNA

Estimating tumor fraction in cell-free DNA from ultra-low-pass whole genome sequencing.

项目地址：https://gitcode.com/gh_mirrors/ic/ichorCNA

登录后查看全文