Foldseek 技术文档

2026-01-25 06:32:03作者：袁立春Spencer

Foldseek 是一款高效的蛋白质结构比对工具，它能够快速并灵敏地处理大规模蛋白质结构集的比较。本文档旨在指导用户了解 Foldseek 的安装流程、基本使用方法、API 概览以及数据库操作，以便您能充分利用该工具的强大功能。

安装指南

预编译二进制文件

Foldseek 提供了适用于不同平台的预编译二进制文件：

对于支持 AVX2 指令集的 Linux 系统：

wget https://mmseqs.com/foldseek/foldseek-linux-avx2.tar.gz; tar xvzf foldseek-linux-avx2.tar.gz; export PATH=$(pwd)/foldseek/bin/:$PATH

对于仅支持 SSE2 的 Linux 系统：

wget https://mmseqs.com/foldseek/foldseek-linux-sse2.tar.gz; tar xvzf foldseek-linux-sse2.tar.gz; export PATH=$(pwd)/foldseek/bin/:$PATH

Linux ARM64 架构：

wget https://mmseqs.com/foldseek/foldseek-linux-arm64.tar.gz; tar xvzf foldseek-linux-arm64.tar.gz; export PATH=$(pwd)/foldseek/bin/:$PATH

MacOS 用户：

wget https://mmseqs.com/foldseek/foldseek-osx-universal.tar.gz; tar xvzf foldseek-osx-universal.tar.gz; export PATH=$(pwd)/foldseek/bin/:$PATH

或者，通过 Conda 在 Linux 和 macOS 上安装：

conda install -c conda-forge -c bioconda foldseek

从源代码编译（可选）

对于需要定制化编译选项的高级用户，可以访问官方仓库获取编译说明。

项目的使用说明

快速启动搜索

以查询单个或多个蛋白质结构为例，命令如下：

foldseek easy-search <query_structure> <database_folder> <output_folder>

其中 <query_structure> 是您的蛋白质结构文件路径，<database_folder> 是目标数据库目录，而 <output_folder> 是保存结果的地方。

结果输出

默认输出: 包含匹配度、长度、错配等信息。
超级位置 PDB 文件: 使用 --format-mode 5 生成目标结构相对于查询结构的超级位置。
交互式 HTML: 指定 --format-mode 3 生成类似网页版的详细结果界面。

参数调整

调整敏感性: -s 值越低，速度越快但可能丢失敏感性。
控制结果数量: -e 设定 E值阈值，--max-seqs 设置最大序列数。

API使用文档

Foldseek API 主要是命令行接口，其核心在于几个关键子命令如 easy-search, createdb, 和 cluster。每个子命令都有详细的参数来控制搜索、数据库创建和聚类行为。例如，easy-search 中 -c 用于控制覆盖范围，--alignment-type 来选择不同的对齐算法。

创建自定义数据库

为了特定任务，用户可通过以下命令创建基于FASTA文件的结构数据库：

foldseek createdb <fasta_file> <db_name> [--prostt5-model <weights_path>]

这里 --prostt5-model 用于利用ProstT5从氨基酸序列预测结构。

内存要求

基于系统的RAM大小和任务需求，Foldsek提供了不同的内存使用策略，确保高效运行。从无需Cα信息减少到35GB，到单查询模式下几乎不限制内存，用户可以根据实际情况选择最适合的方式。

总结

Foldseek为蛋白质结构相似性搜索提供了一个强大的工具箱。通过遵循上述指南，用户应该能够顺利安装和应用Foldseek进行复杂的数据分析。记得查阅官方wiki页面获取更多模块详情和高级使用案例。

foldseek

Foldseek enables fast and sensitive comparisons of large structure sets.

项目地址：https://gitcode.com/gh_mirrors/fo/foldseek

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

202

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

Foldseek 技术文档

安装指南

预编译二进制文件

从源代码编译（可选）

项目的使用说明

快速启动搜索

结果输出

参数调整

API使用文档

创建自定义数据库

内存要求

总结

热门内容推荐

最新内容推荐

项目优选

Foldseek 技术文档

安装指南

预编译二进制文件

从源代码编译（可选）

项目的使用说明

快速启动搜索

结果输出

参数调整

API使用文档

创建自定义数据库

内存要求

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选