Edibble项目教程：实验设计中的结构定义方法

2025-06-26 11:19:32作者：龚格成

引言

在农业科学和生物统计领域，设计合理的田间试验对研究结果的可信度至关重要。本文将介绍如何使用edibble包来定义实验设计的结构，特别聚焦于小麦田间试验的设计过程。edibble提供了一套直观且灵活的工具，帮助研究人员清晰地定义实验单元、处理因素及其相互关系。

实验设计初始化

任何edibble设计都从初始化设计对象开始。这相当于为整个实验建立一个容器，后续的所有设计元素都将添加至此。

design("小麦田间试验")

初始化时可以指定实验标题，这个信息将作为元数据保存在对象中，并在输出和导出文件时显示。

定义实验单元

基本单元定义

实验设计中最基本的元素是实验单元，使用set_units()函数定义。下面代码创建了包含4个试验地点的设计：

demo <- design("单元定义演示") %>% 
  set_units(地点 = 4)

单元水平默认会自动命名为"地点1"、"地点2"等。如果需要特定名称，可以直接提供字符向量：

design("指定名称的单元") %>% 
  set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西")) %>% 
  serve_table()

嵌套单元结构

田间试验通常具有层次结构。例如，每个地点可能包含多个小区。edibble使用nested_in()辅助函数定义这种嵌套关系：

design("嵌套结构演示") %>% 
  set_units(地点 = 4,
           小区 = nested_in(地点, 18)) %>% 
  serve_table()

交叉单元结构

当实验单元以矩形阵列排列时（如行和列），可以使用crossed_by()定义交叉结构：

design("交叉结构演示") %>% 
  set_units(行 = 6,
           列 = 3,
           小区 = crossed_by(行, 列)) %>% 
  serve_table()

复杂单元结构

结合嵌套和交叉结构可以构建更复杂的实验设计。例如，四个地点，每个地点有3行6列的小区：

complex <- design("复杂结构") %>% 
  set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西"),
           列 = nested_in(地点, 6),
           行 = nested_in(地点, 3),
           小区 = nested_in(地点, crossed_by(行, 列))) 

serve_table(complex, label_nested = c(行, 列))

定义处理因素

基本处理定义

处理因素使用set_trts()定义。下面示例定义了三个处理因素：品种、肥料类型和施肥量：

factrt <- design("因子处理") %>% 
  set_trts(品种 = c("a", "b"),
           肥料 = c("A", "B"),
           施肥量 = c(0.5, 1, 2))

默认情况下，所有处理因素都是交叉的。可以使用trts_table()查看完整的处理组合：

trts_table(factrt)

条件处理结构

某些处理因素可能依赖于其他因素。例如，当不施肥时，施肥量应为0：

factrtc <- design("带对照的因子处理") %>% 
  set_trts(品种 = c("a", "b"),
           肥料 = c("无", "A", "B"),
           施肥量 = conditioned_on(肥料,
                                   "无" ~ 0,
                                        . ~ c(0.5, 1, 2)))

建立因素间关系

分配处理到单元

使用allot_trts()定义处理因素如何分配到实验单元：

alloted1 <- (complex + factrtc) %>% 
  allot_trts(肥料 ~ 行,
             施肥量:品种 ~ 小区)

处理分配算法

edibble提供多种分配算法：

"systematic"：系统分配，处理水平按顺序分配到单元
"systematic-random"：随机化处理顺序后系统分配
"random"：完全随机分配

design1 <- alloted1 %>% 
  assign_trts(order = c("systematic", "random"),
              seed = 2023) %>% 
  serve_table(label_nested = c(行, 列))

实际应用示例

假设我们需要设计一个小麦田间试验：

4个地点，其中2个地点有9列，其他有6列
3行每个地点
3个品种
2种肥料类型（含对照）
3种施肥量（对照时为0）

完整设计代码如下：

final_design <- design("小麦品种比较试验") %>%
  # 定义单元结构
  set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西"),
            列 = nested_in(地点, 
                      c("纳拉布里", "罗斯沃西") ~ 9,
                                            . ~ 6),
            行 = nested_in(地点, 3),
           小区 = nested_in(地点, crossed_by(行, 列))) %>%
  # 定义处理因素
  set_trts(品种 = c("A", "B", "C"),
           肥料 = c("无", "X", "Y"),
           施肥量 = conditioned_on(肥料,
                                   "无" ~ 0,
                                        . ~ c(0.5, 1, 2))) %>%
  # 分配处理到单元
  allot_trts(肥料 ~ 行,
             施肥量:品种 ~ 小区) %>%
  # 执行分配
  assign_trts(order = c("systematic", "random"),
              seed = 2023) %>%
  # 生成设计表
  serve_table(label_nested = c(行, 列))