首页
/ RFdiffusion 蛋白质设计框架使用教程

RFdiffusion 蛋白质设计框架使用教程

2026-02-06 04:56:25作者:董斯意

RFdiffusion 是一个开源的蛋白质结构生成工具,支持无条件生成和条件生成(基于模体、靶点等)。它能够执行多种蛋白质设计任务,包括模体支架设计、无条件蛋白质生成、对称生成、结合物设计等。

项目概述

RFdiffusion 基于扩散模型技术,能够生成高质量的蛋白质结构。项目由 RosettaCommons 团队开发,提供了完整的蛋白质设计解决方案。

RFdiffusion 蛋白质设计

安装指南

克隆仓库

git clone https://gitcode.com/gh_mirrors/rf/RFdiffusion
cd RFdiffusion

下载模型权重

mkdir models && cd models
wget http://files.ipd.uw.edu/pub/RFdiffusion/6f5902ac237024bdd0c176cb93063dc4/Base_ckpt.pt
wget http://files.ipd.uw.edu/pub/RFdiffusion/e29311f6f1bf1af907f9ef9f44b8328b/Complex_base_ckpt.pt
wget http://files.ipd.uw.edu/pub/RFdiffusion/60f09a193fb5e5ccdc4980417708dbab/Complex_Fold_base_ckpt.pt
wget http://files.ipd.uw.edu/pub/RFdiffusion/74f51cfb8b440f50d70878e05361d8f0/InpaintSeq_ckpt.pt
wget http://files.ipd.uw.edu/pub/RFdiffusion/76d00716416567174cdb7ca96e208296/InpaintSeq_Fold_ckpt.pt
wget http://files.ipd.uw.edu/pub/RFdiffusion/5532d2e1f3a4738decd58b19d633b3c3/ActiveSite_ckpt.pt
wget http://files.ipd.uw.edu/pub/RFdiffusion/12fc204edeae5b57713c5ad7dcb97d39/Base_epoch8_ckpt.pt

安装 SE3-Transformer 环境

conda env create -f env/SE3nv.yml
conda activate SE3nv
cd env/SE3Transformer
pip install --no-cache-dir -r requirements.txt
python setup.py install
cd ../..
pip install -e .

使用方法

基本执行 - 无条件单体生成

生成一个长度为150个氨基酸的蛋白质:

python scripts/run_inference.py 'contigmap.contigs=[150-150]' inference.output_prefix=test_outputs/test inference.num_designs=10

模体支架设计

模体支架设计允许您在现有蛋白质模体周围构建新的支架结构:

python scripts/run_inference.py 'contigmap.contigs=[5-15/A10-25/30-40]' inference.input_pdb=path/to/file.pdb inference.output_prefix=test_outputs/motif_test inference.num_designs=10

结合物设计

设计针对特定靶点的蛋白质结合物:

python scripts/run_inference.py 'contigmap.contigs=[B1-100/0 100-100]' 'ppi.hotspot_res=[A30,A33,A34]' inference.output_prefix=test_outputs/binder_test inference.num_designs=10

结合物设计示例

部分扩散

对现有结构进行部分噪声和去噪以产生多样性:

python scripts/run_inference.py 'contigmap.contigs=[100-100/0 B1-150]' diffuser.partial_T=20 inference.output_prefix=test_outputs/partial_test inference.num_designs=10

配置文件说明

RFdiffusion 使用 Hydra 配置文件来管理推理参数。主要配置文件位于 config/inference/base.yaml,包含了默认的推理参数设置。

RFdiffusion 主要功能

目录结构

RFdiffusion/
├── config/              # 配置文件目录
├── docker/              # Docker 相关文件
├── examples/            # 使用示例
├── helper_scripts/      # 辅助脚本
├── img/                 # 图片资源
├── rfdiffusion/         # 核心代码
├── scripts/             # 运行脚本
└── tests/               # 测试文件

示例脚本

项目提供了多个示例脚本,位于 examples/ 目录下:

  • design_unconditional.sh - 无条件生成示例
  • design_motifscaffolding.sh - 模体支架设计示例
  • design_ppi.sh - 蛋白质-蛋白质相互作用设计示例
  • design_partialdiffusion.sh - 部分扩散示例

输出文件说明

RFdiffusion 生成的输出文件包括:

  • .pdb 文件 - 生成的蛋白质结构
  • 轨迹文件 - 记录扩散过程
  • 日志文件 - 包含运行详细信息

注意事项

  1. 首次运行 RFdiffusion 时需要计算 IGSO3,这会花费一些时间,但计算结果会被缓存以供后续使用
  2. 确保使用正确的 conda 环境:conda activate SE3nv
  3. 对于大型靶点蛋白,建议进行截断以提高计算效率
  4. 结合物设计时建议提供热点残基信息以提高成功率

模体支架设计

RFdiffusion 是一个强大的蛋白质设计工具,通过合理配置参数和使用适当的模型权重,可以生成高质量的蛋白质结构设计。建议用户先从简单的示例开始,逐步掌握更复杂的设计任务。

登录后查看全文
热门项目推荐
相关项目推荐