在microeco项目中基于FungalTraits筛选特定功能真菌ASV的方法

2026-02-04 05:17:07作者：廉皓灿Ida

背景介绍

在微生物生态学研究中，我们经常需要从复杂的微生物群落数据中筛选出具有特定功能的微生物类群。microeco作为一个强大的R包，提供了便捷的工具来处理和分析微生物组数据。本文将详细介绍如何利用microeco包中的功能预测模块，基于FungalTraits数据库筛选植物病原真菌ASV(扩增子序列变体)的方法。

核心步骤解析

1. 数据准备与转换

首先需要将phyloseq对象转换为microeco的microtable对象格式：

# 转换phyloseq对象为microtable对象
mt_fungi <- phyloseq2meco(filter_fungi)

microtable对象包含三个主要组成部分：

sample_table: 样本信息表
otu_table: ASV/OTU丰度表
tax_table: 分类学信息表

2. 数据一致性处理

使用tidy_dataset()方法确保OTU表和样本信息的一致性：

mt_fungi$tidy_dataset()

这一步会自动移除那些在OTU表中没有对应样本或在样本信息中没有对应OTU的数据。

3. 功能预测分析

通过trans_func模块进行真菌功能预测：

t1 <- trans_func$new(mt_fungi)
t1$cal_spe_func(fungi_database = "FungalTraits")
t1$cal_spe_func_perc(abundance_weighted = TRUE)

这里使用了FungalTraits数据库来预测每个ASV的功能特征，包括其可能的生活方式(如植物病原菌)。

4. 目标ASV筛选

从预测结果中提取植物病原菌ASV的名称：

ASVs_PP <- rownames(t1$res_spe_func[t1$res_spe_func$`primary_lifestyle|plant_pathogen` > 0,])

5. 数据子集提取

与phyloseq不同，microeco中直接操作otu_table来提取子集：

library(magrittr)
mt_fungi$otu_table %<>% .[ASVs_PP, ]
mt_fungi$tidy_dataset()

技术要点说明

数据结构差异：microeco使用标准data.frame存储otu_table和tax_table，这与phyloseq的特定数据结构不同，使得数据操作更加灵活。
自动数据整理：tidy_dataset()方法会自动移除空样本和空ASV，确保数据一致性。
功能预测结果：trans_func模块的预测结果存储在res_spe_func中，可以直接基于这些结果进行筛选。
管道操作：使用magrittr包的管道操作符%<>%可以简化代码，实现数据就地修改。