LigandMPNN完整指南：从零开始掌握蛋白质序列设计

2026-02-06 05:06:27作者：宣聪麟

项目地址：https://gitcode.com/gh_mirrors/li/LigandMPNN

想要快速掌握蛋白质序列设计的最新工具吗？LigandMPNN作为基于深度学习的蛋白质序列设计工具，正在革命性地改变药物发现和蛋白质工程领域。本终极教程将带您从基础安装到高级应用，全面解锁这个免费开源工具的强大功能。

🚀 一键安装：最快配置方法

无需复杂的环境配置，只需简单几步即可开始使用LigandMPNN：

git clone https://gitcode.com/gh_mirrors/li/LigandMPNN.git
cd LigandMPNN

接着安装必要的依赖：

pip install -r requirements.txt

系统将自动为您配置好所有必要的环境组件，让您专注于核心的蛋白质设计任务。

💡 核心功能：为什么选择LigandMPNN

LigandMPNN相比传统蛋白质设计工具具有三大独特优势：

1. 原子级精度设计

支持完整的蛋白质残基索引、链字母和插入码
保留输入PDB文件中的所有结构信息
输出包含完整链信息的PDB文件

2. 灵活的残基控制

可直接使用残基索引进行偏置、固定和重新设计
示例：A23（链A，索引23），B42D（链B，索引42，插入码D）

3. 多模型支持

内置ProteinMPNN、LigandMPNN、SolubleMPNN等多种模型
支持全局和逐残基的膜标签

🎯 实战应用：如何快速上手

基础序列设计示例

从最简单的默认设置开始：

python run.py \
        --seed 111 \
        --pdb_path "./inputs/1BC8.pdb" \
        --out_folder "./outputs/default"

高级参数调节

温度控制 - 改变采样温度以获得更多序列多样性：

python run.py \
        --seed 111 \
        --pdb_path "./inputs/1BC8.pdb" \
        --temperature 0.05 \
        --out_folder "./outputs/temperature"

残基固定 - 指定特定的氨基酸保持不变：

python run.py \
        --seed 111 \
        --pdb_path "./inputs/1BC8.pdb" \
        --out_folder "./outputs/fix_residues" \
        --fixed_residues "C1 C2 C3 C4 C5 C6 C7 C8 C9 C10" \
        --bias_AA "A:10.0"

🔧 技术生态：完整的工作流整合

LigandMPNN与开源生物信息学工具完美集成：

数据预处理模块

完整的PDB文件解析功能
支持缺失残基处理
原子坐标特征提取

模型架构核心

消息传递神经网络
128维节点特征
128维边特征
3层编码器+3层解码器

侧链包装系统

基于Openfold的辅助函数
支持多构象采样
配体上下文感知

📊 典型应用场景

药物分子设计

使用LigandMPNN进行小分子药物的结合位点优化：

python run.py \
        --model_type "ligand_mpnn" \
        --seed 111 \
        --pdb_path "./inputs/1BC8.pdb" \
        --out_folder "./outputs/ligandmpnn_default"

蛋白质工程

设计具有特定功能的蛋白质变体：

python run.py \
        --model_type "ligand_mpnn" \
        --seed 111 \
        --pdb_path "./inputs/1BC8.pdb" \
        --out_folder "./outputs/ligandmpnn_v_32_005_25" \
        --checkpoint_ligand_mpnn "./model_params/ligandmpnn_v_32_005_25"

🎪 进阶技巧：专家级配置指南

批量处理多个PDB文件

使用--pdb_path_multi参数高效处理多个结构：

python run.py \
        --pdb_path_multi "./inputs/pdb_ids.json" \
        --out_folder "./outputs/pdb_path_multi" \
        --seed 111

对称性设计

创建同源寡聚体或二态蛋白质：

python run.py \
        --model_type "ligand_mpnn" \
        --seed 111 \
        --pdb_path "./inputs/4GYT.pdb" \
        --out_folder "./outputs/homooligomer" \
        --homo_oligomer 1 \
        --number_of_batches 2