使用microeco包筛选微生物群落中的稀有与优势类群

2026-02-04 04:30:41作者：咎岭娴Homer

引言

在微生物生态学研究中，了解群落中不同丰度类群的分布特征对于揭示微生物群落结构和功能具有重要意义。microeco作为一个强大的R语言包，为微生物群落数据分析提供了全面的解决方案。本文将详细介绍如何使用microeco包筛选微生物群落中的稀有类群、优势类群以及各种中间状态的类群。

准备工作

首先需要加载必要的R包并准备数据：

library(microeco)
library(magrittr)

# 创建microtable对象
d1 <- microtable$new(otu_table_16S, tax_table = taxonomy_table_16S)

# 数据标准化为相对丰度
t1 <- trans_norm$new(d1)
d1 <- t1$norm(method = "TSS")

类群分类标准

根据微生物类群在不同样本中的分布特征，可以将其分为以下几类：

始终优势类群(AAT)：在所有样本中相对丰度≥1%
始终稀有类群(ART)：在所有样本中相对丰度<0.01%
中等丰度类群(MT)：在所有样本中相对丰度介于0.01%-1%之间
条件稀有类群(CRT)：在所有样本中丰度<1%，且在某些样本中<0.01%
条件优势类群(CAT)：在所有样本中丰度≥0.01%，在某些样本中≥1%
条件稀有和优势类群(CRAT)：丰度从稀有(<0.01%)到优势(≥1%)变化

类群筛选方法

方法一：使用apply函数直接筛选

这种方法直接对OTU表进行操作，逻辑清晰：

# 1. 始终优势类群(AAT)
sel_logical <- apply(d1$otu_table, 1, function(x){all(x > 0.01)})
AAT <- rownames(d1$otu_table)[sel_logical]

# 2. 始终稀有类群(ART)
sel_logical <- apply(d1$otu_table, 1, function(x){all(x < 0.0001)})
ART <- rownames(d1$otu_table)[sel_logical]

# 3. 中等丰度类群(MT)
sel_logical <- apply(d1$otu_table, 1, function(x){all(x > 0.0001 & x < 0.01)})
MT <- rownames(d1$otu_table)[sel_logical]

# 4. 条件稀有类群(CRT)
sel_logical <- apply(d1$otu_table, 1, function(x){all(x < 0.01) & any(x < 0.0001)})
CRT <- rownames(d1$otu_table)[sel_logical]

# 5. 条件优势类群(CAT)
sel_logical <- apply(d1$otu_table, 1, function(x){all(x > 0.0001) & any(x > 0.01)})
CAT <- rownames(d1$otu_table)[sel_logical]

# 6. 条件稀有和优势类群(CRAT)
sel_logical <- apply(d1$otu_table, 1, function(x){any(x > 0.01) & any(x < 0.0001)})
CRAT <- rownames(d1$otu_table)[sel_logical]

方法二：使用filter_taxa函数筛选

虽然稍复杂，但更符合microeco包的操作风格：

# 1. 始终优势类群(AAT)
tmp <- clone(d1)
tmp$otu_table[d1$otu_table < 0.01] <- 0
tmp$filter_taxa(freq = ncol(d1$otu_table))

# 2. 始终稀有类群(ART)
tmp <- clone(d1)
tmp$otu_table[d1$otu_table < 0.0001] <- 0
tmp$filter_taxa(freq = 1)
ART2 <- rownames(d1$otu_table) %>% .[!. %in% rownames(tmp$otu_table)]

# 3. 中等丰度类群(MT)
tmp <- clone(d1)
tmp$otu_table[d1$otu_table > 0.01] <- 0
tmp$otu_table[d1$otu_table < 0.0001] <- 0
tmp$filter_taxa(freq = ncol(d1$otu_table))

# 4. 条件稀有类群(CRT)
CRT_rmhigh <- clone(d1)
CRT_rmhigh$otu_table[d1$otu_table < 0.01] <- 0
CRT_rmhigh$filter_taxa(freq = 1)
CRT_rmlow <- clone(d1)
CRT_rmlow$otu_table[d1$otu_table < 0.0001] <- 0
CRT_rmlow$filter_taxa(freq = ncol(d1$otu_table))
CRT2 <- rownames(d1$otu_table) %>% .[!. %in% rownames(CRT_rmhigh$otu_table)] %>% .[!. %in% rownames(CRT_rmhigh$otu_table)]

# 5. 条件优势类群(CAT)
CAT_low <- clone(d1)
CAT_low$otu_table[d1$otu_table < 0.0001] <- 0
CAT_low$filter_taxa(freq = ncol(d1$otu_table))
CAT_high <- clone(d1)
CAT_high$otu_table[d1$otu_table < 0.01] <- 0
CAT_high$filter_taxa(freq = 1)
CAT2 <- intersect(rownames(CAT_low$otu_table), rownames(CAT_high$otu_table))

# 6. 条件稀有和优势类群(CRAT)
CRAT_rmlow <- clone(d1)
CRAT_rmlow$otu_table[d1$otu_table <= 0.0001] <- 0
CRAT_rmlow$filter_taxa(freq = ncol(d1$otu_table))
CRAT_low <- rownames(d1$otu_table) %>% .[!. %in% rownames(CRAT_rmlow$otu_table)]
CRAT_high <- clone(d1)
CRAT_high$otu_table[d1$otu_table < 0.01] <- 0
CRAT_high$filter_taxa(freq = 1)
CRAT2 <- intersect(CRAT_low, rownames(CRAT_high$otu_table))

创建特定类群的microtable对象

筛选出特定类群后，可以创建包含完整信息的microtable对象：

# 以始终稀有类群(ART)为例
ART_mt <- clone(d1)
ART_mt$otu_table %<>% .[ART, ]
ART_mt$tidy_dataset()

tidy_dataset()方法会自动整理对象，移除OTU表中不存在的分类信息和样本信息。

应用建议

数据标准化：在进行类群筛选前，务必确保数据已标准化为相对丰度(如TSS方法)
阈值选择：根据研究目的调整丰度阈值，不同生态系统可能需要不同的阈值标准
结果验证：建议使用两种方法交叉验证筛选结果
后续分析：筛选出的类群可用于差异分析、网络分析等下游分析

结论

microeco包提供了灵活的方法来筛选微生物群落中的不同丰度类群。通过合理设置丰度阈值，研究人员可以有效地识别和研究群落中的稀有类群、优势类群及其过渡类型，为深入理解微生物群落结构和功能提供重要依据。

microeco

An R package for downstream data analysis of microbiome omics data

项目地址：https://gitcode.com/gh_mirrors/mi/microeco

登录后查看全文

使用microeco包筛选微生物群落中的稀有与优势类群

引言

准备工作

类群分类标准

类群筛选方法

方法一：使用apply函数直接筛选

方法二：使用filter_taxa函数筛选

创建特定类群的microtable对象

应用建议

结论

热门内容推荐

最新内容推荐

项目优选

使用microeco包筛选微生物群落中的稀有与优势类群

引言

准备工作

类群分类标准

类群筛选方法

方法一：使用apply函数直接筛选

方法二：使用filter_taxa函数筛选

创建特定类群的microtable对象

应用建议

结论

相关内容推荐

热门内容推荐

最新内容推荐

项目优选