AlphaFold3 中双链抗体结构预测的输入文件配置指南

2025-06-03 18:34:39作者：伍希望

理解AlphaFold3的输入要求

AlphaFold3作为DeepMind推出的最新蛋白质结构预测工具，在处理复杂蛋白质复合物时展现了强大的能力。对于抗体这类由重链(H链)和轻链(L链)组成的特殊蛋白质，正确配置输入文件是获得准确预测结果的关键前提。

双链抗体的JSON文件结构

在AlphaFold3中，预测双链抗体结构需要构建特定的JSON输入文件。该文件需要明确指定两条独立的蛋白质链序列及其对应标识符。以下是标准格式：

{
  "name": "自定义任务名称",
  "sequences": [
    {
      "proteinChain": {
        "sequence": "重链氨基酸序列",
        "count": 1,
        "useStructureTemplate": true
      }
    },
    {
      "proteinChain": {
        "sequence": "轻链氨基酸序列",
        "count": 1,
        "useStructureTemplate": true
      }
    }
  ],
  "modelSeeds": [1454560155],
  "dialect": "alphafoldserver",
  "version": 1
}

关键参数解析

name字段：为预测任务指定一个描述性名称，便于后续识别。
sequences数组：包含两个独立对象，分别对应抗体的重链和轻链。
proteinChain对象：
- sequence：必须提供完整的氨基酸单字母序列
- count：设置为1表示单拷贝
- useStructureTemplate：建议设为true以启用模板辅助预测
modelSeeds：随机数种子，影响模型初始化，可保持默认。
dialect和version：指定使用的AlphaFold版本和API格式。

实际应用示例

假设我们需要预测一个抗体，其重链序列为"VQLQESDAELVKPG..."，轻链序列为"IELTQSPSSLSASL..."，则完整的JSON配置如下：

{
  "name": "抗体结构预测_2025",
  "sequences": [
    {
      "proteinChain": {
        "sequence": "VQLQESDAELVKPGASVKISCKASGYTFTDHVIHWVKQKPEQGLEWIGYISPGNGDIKYNEKFKGKATLTADKSSSTAYMQLNSLTSEDSAVYLCKRGYYVDYWGQGTTLTVSSAKTTPPSVYPLAPSMVTLGCLVKGYFPEPVTVTWNSGSLSSGVHTFPAVLQSDLYTLSSSVTVPSSTWPSETVTCNVAHPASSTKVDKKIE",
        "count": 1,
        "useStructureTemplate": true
      }
    },
    {
      "proteinChain": {
        "sequence": "IELTQSPSSLSASLGGKVTITCKASQDIKKYIGWYQHKPGKQPRLLIHYTSTLLPGIPSRFRGSGSGRDYSFSISNLEPEDIATYYCLQYYNLRTFGGGTKLEIKRADAAPTVSIFPPSSEQLTSGGASVVCFLNNFYSKDINVKWKIDGSERQNGVLNSWTDQDSKDSTYSMSSTLTLTKDEYERHNSYTCEATHKTSTSPIVKSFNRNE",
        "count": 1,
        "useStructureTemplate": true
      }
    }
  ],
  "modelSeeds": [1],
  "dialect": "alphafold3",
  "version": 1
}