Protpardelle: 全原子蛋白质生成模型使用指南
项目介绍
Protpardelle 是一个基于扩散模型的全原子蛋白质结构生成工具。该模型能够代表所有侧链状态作为一个“叠加”态,从而在蛋白质设计中提供了一种创新的方法。它适用于无条件和条件性蛋白质设计,支持从头生成具有特定属性或结合特定配体的蛋白质结构。项目由 ProteinDesignLab 开发,并且其源码托管于 GitHub,旨在促进蛋白质结构设计的研究与应用。
项目快速启动
环境配置
首先,你需要安装 Conda 环境,然后创建并激活 Protpardelle 的环境:
conda env create -f configs/environment.yml
conda activate delle
注意到,你还需下载并置于相同目录下的 ProteinMPNN 仓库,用于协同工作。此外,调整配置文件中的路径以指向正确的位置。
使用示例
在线WebApp体验
你可以通过访问 Hugging Face WebApp 直接在线使用 Protpardelle,无需本地安装。
PyMOL 中的设计
将 protpardelle_pymol.py 文件下载到你的电脑,然后在 PyMol 中加载执行此脚本。例如,对名为 my_pdb.pdb 的结构进行部分残基重新设计,可以运行如下命令:
load protpardelle_pymol.py
protpardelle my_pdb.pdb 0-25 70-80
命令行样本生成
若要无条件地生成长度在50到60之间(步长为5)的蛋白质结构,每长度产生1个样本,可执行:
python draw_samples.py --type allatom --minlen 50 --maxlen 60 --steplen 5 --perlen 1
应用案例和最佳实践
Protpardelle 能够应用于多个场景,包括但不限于:
- 无条件设计:探索新的蛋白质折叠结构。
- 条件性设计:基于现有蛋白结构进行改造,比如特定活性位点的突变设计。
- 药物发现:设计与特定靶标紧密结合的肽段。
- 教育与研究:作为教学工具演示蛋白质结构变化的可能性。
最佳实践是先从简单的无条件设计开始,熟悉工具之后再尝试更复杂的条件性设计任务,利用提供的示例脚本来理解不同参数如何影响设计结果。
典型生态项目
虽然Protpardelle本身构成了一个独特的生态系统部件,其与蛋白质结构预测和设计领域的其他开源工具如Rosetta和DeepMind的AlphaFold合作,能够构成更广泛的应用生态。社区成员可以通过贡献自己的训练数据集、开发新的条件设计算法或是优化现有的模型架构来扩展这一生态。
以上便是Protpardelle的基本使用指南。深入学习和高级定制则要求进一步查阅项目文档和参与社区讨论,以便充分利用这一强大的蛋白质设计工具。
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00- DDeepSeek-OCR暂无简介Python00
openPangu-Ultra-MoE-718B-V1.1昇腾原生的开源盘古 Ultra-MoE-718B-V1.1 语言模型Python00
HunyuanWorld-Mirror混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00
AI内容魔方AI内容专区,汇集全球AI开源项目,集结模块、可组合的内容,致力于分享、交流。03
Spark-Scilit-X1-13BFLYTEK Spark Scilit-X1-13B is based on the latest generation of iFLYTEK Foundation Model, and has been trained on multiple core tasks derived from scientific literature. As a large language model tailored for academic research scenarios, it has shown excellent performance in Paper Assisted Reading, Academic Translation, English Polishing, and Review Generation, aiming to provide efficient and accurate intelligent assistance for researchers, faculty members, and students.Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile013
Spark-Chemistry-X1-13B科大讯飞星火化学-X1-13B (iFLYTEK Spark Chemistry-X1-13B) 是一款专为化学领域优化的大语言模型。它由星火-X1 (Spark-X1) 基础模型微调而来,在化学知识问答、分子性质预测、化学名称转换和科学推理方面展现出强大的能力,同时保持了强大的通用语言理解与生成能力。Python00- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00