Seqtk 使用与技术文档

2024-12-27 13:10:29作者：盛欣凯Ernestine

1. 安装指南

Seqtk 是一款用于处理 FASTA 或 FASTQ 格式序列的快速轻量级工具。它能够无缝解析 FASTA 和 FASTQ 文件，并且可以选择性地处理由 gzip 压缩的文件。安装 seqtk 的步骤如下：

git clone https://github.com/lh3/seqtk.git;
cd seqtk; make

该工具的唯一库依赖是 zlib。

2. 项目使用说明

Seqtk 提供了多种命令行操作，用于不同的序列处理任务。以下是一些常用的操作示例：

将 FASTQ 转换为 FASTA 格式：

seqtk seq -a in.fq.gz > out.fa

将 ILLUMINA 1.3+ FASTQ 转换为 FASTA，并将质量低于 20 的碱基转换为大写字母（第一个命令行）或 'N'（第二个命令行）：

seqtk seq -aQ64 -q20 in.fq > out.fa
seqtk seq -aQ64 -q20 -n N in.fq > out.fa

折叠过长的 FASTA/Q 行并移除 FASTA/Q 注释：

seqtk seq -Cl60 in.fa > out.fa

将多行 FASTQ 转换为 4 行 FASTQ：

seqtk seq -l0 in.fq > out.fq

反向互补 FASTA/Q 序列：

seqtk seq -r in.fq > out.fq

从文件 name.lst 中提取名称列表中的序列，每个序列名称一行：

seqtk subseq in.fq name.lst > out.fq

提取文件 reg.bed 中包含的区域内的序列：

seqtk subseq in.fa reg.bed > out.fa

将 reg.bed 文件中的区域遮蔽为小写字母：

seqtk seq -M reg.bed in.fa > out.fa

从两个大型的配对 FASTQ 文件中随机抽取 10000 个读段对（使用相同的随机种子以保持配对）：

seqtk sample -s100 read1.fq 10000 > sub1.fq
seqtk sample -s100 read2.fq 10000 > sub2.fq

使用 Phred 算法从序列的两端修剪低质量碱基：

seqtk trimfq in.fq > out.fq

从每个读段的左侧修剪 5bp，从右侧修剪 10bp：

seqtk trimfq -b 5 -e 10 in.fa > out.fa

查找 (TTAGGG)n 重复序列：

seqtk telo seq.fa > telo.bed 2> telo.count

3. 项目 API 使用文档

Seqtk 工具不提供传统意义上的 API，它主要是通过命令行界面进行操作的。上述使用说明中的命令行参数即为该工具的“API”，用户可以通过不同的参数组合来实现各种序列处理任务。

4. 项目安装方式

项目的安装方式已在“安装指南”部分说明，简要概括如下：

克隆项目仓库
进入项目目录
使用 make 命令编译

git clone https://github.com/lh3/seqtk.git;
cd seqtk; make

以上步骤完成后，即可在 seqtk 目录下使用 seqtk 工具。

seqtk

Toolkit for processing sequences in FASTA/Q formats

项目地址：https://gitcode.com/gh_mirrors/se/seqtk

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

457

440

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

Python

1 K

610

Seqtk 使用与技术文档

1. 安装指南

2. 项目使用说明

3. 项目 API 使用文档

4. 项目安装方式

热门内容推荐

最新内容推荐

项目优选

Seqtk 使用与技术文档

1. 安装指南

2. 项目使用说明

3. 项目 API 使用文档

4. 项目安装方式

相关内容推荐

热门内容推荐

最新内容推荐

项目优选