Edibble项目教程:实验设计中的结构定义方法
引言
在农业科学和生物统计领域,设计合理的田间试验对研究结果的可信度至关重要。本文将介绍如何使用edibble包来定义实验设计的结构,特别聚焦于小麦田间试验的设计过程。edibble提供了一套直观且灵活的工具,帮助研究人员清晰地定义实验单元、处理因素及其相互关系。
实验设计初始化
任何edibble设计都从初始化设计对象开始。这相当于为整个实验建立一个容器,后续的所有设计元素都将添加至此。
design("小麦田间试验")
初始化时可以指定实验标题,这个信息将作为元数据保存在对象中,并在输出和导出文件时显示。
定义实验单元
基本单元定义
实验设计中最基本的元素是实验单元,使用set_units()函数定义。下面代码创建了包含4个试验地点的设计:
demo <- design("单元定义演示") %>%
set_units(地点 = 4)
单元水平默认会自动命名为"地点1"、"地点2"等。如果需要特定名称,可以直接提供字符向量:
design("指定名称的单元") %>%
set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西")) %>%
serve_table()
嵌套单元结构
田间试验通常具有层次结构。例如,每个地点可能包含多个小区。edibble使用nested_in()辅助函数定义这种嵌套关系:
design("嵌套结构演示") %>%
set_units(地点 = 4,
小区 = nested_in(地点, 18)) %>%
serve_table()
交叉单元结构
当实验单元以矩形阵列排列时(如行和列),可以使用crossed_by()定义交叉结构:
design("交叉结构演示") %>%
set_units(行 = 6,
列 = 3,
小区 = crossed_by(行, 列)) %>%
serve_table()
复杂单元结构
结合嵌套和交叉结构可以构建更复杂的实验设计。例如,四个地点,每个地点有3行6列的小区:
complex <- design("复杂结构") %>%
set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西"),
列 = nested_in(地点, 6),
行 = nested_in(地点, 3),
小区 = nested_in(地点, crossed_by(行, 列)))
serve_table(complex, label_nested = c(行, 列))
定义处理因素
基本处理定义
处理因素使用set_trts()定义。下面示例定义了三个处理因素:品种、肥料类型和施肥量:
factrt <- design("因子处理") %>%
set_trts(品种 = c("a", "b"),
肥料 = c("A", "B"),
施肥量 = c(0.5, 1, 2))
默认情况下,所有处理因素都是交叉的。可以使用trts_table()查看完整的处理组合:
trts_table(factrt)
条件处理结构
某些处理因素可能依赖于其他因素。例如,当不施肥时,施肥量应为0:
factrtc <- design("带对照的因子处理") %>%
set_trts(品种 = c("a", "b"),
肥料 = c("无", "A", "B"),
施肥量 = conditioned_on(肥料,
"无" ~ 0,
. ~ c(0.5, 1, 2)))
建立因素间关系
分配处理到单元
使用allot_trts()定义处理因素如何分配到实验单元:
alloted1 <- (complex + factrtc) %>%
allot_trts(肥料 ~ 行,
施肥量:品种 ~ 小区)
处理分配算法
edibble提供多种分配算法:
- "systematic":系统分配,处理水平按顺序分配到单元
- "systematic-random":随机化处理顺序后系统分配
- "random":完全随机分配
design1 <- alloted1 %>%
assign_trts(order = c("systematic", "random"),
seed = 2023) %>%
serve_table(label_nested = c(行, 列))
实际应用示例
假设我们需要设计一个小麦田间试验:
- 4个地点,其中2个地点有9列,其他有6列
- 3行每个地点
- 3个品种
- 2种肥料类型(含对照)
- 3种施肥量(对照时为0)
完整设计代码如下:
final_design <- design("小麦品种比较试验") %>%
# 定义单元结构
set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西"),
列 = nested_in(地点,
c("纳拉布里", "罗斯沃西") ~ 9,
. ~ 6),
行 = nested_in(地点, 3),
小区 = nested_in(地点, crossed_by(行, 列))) %>%
# 定义处理因素
set_trts(品种 = c("A", "B", "C"),
肥料 = c("无", "X", "Y"),
施肥量 = conditioned_on(肥料,
"无" ~ 0,
. ~ c(0.5, 1, 2))) %>%
# 分配处理到单元
allot_trts(肥料 ~ 行,
施肥量:品种 ~ 小区) %>%
# 执行分配
assign_trts(order = c("systematic", "random"),
seed = 2023) %>%
# 生成设计表
serve_table(label_nested = c(行, 列))
总结
edibble提供了强大而灵活的工具来定义复杂的实验设计结构。通过本文介绍的方法,研究人员可以:
- 清晰地定义实验单元及其层次结构
- 准确地描述处理因素及其相互关系
- 灵活地控制处理分配到单元的方式
- 生成可直接用于分析的设计表格
这种结构化的设计方法不仅提高了实验设计的透明度,也为后续的统计分析奠定了良好基础。
kernelopenEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。C0130
let_datasetLET数据集 基于全尺寸人形机器人 Kuavo 4 Pro 采集,涵盖多场景、多类型操作的真实世界多任务数据。面向机器人操作、移动与交互任务,支持真实环境下的可扩展机器人学习00
mindquantumMindQuantum is a general software library supporting the development of applications for quantum computation.Python059
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
AgentCPM-ReportAgentCPM-Report是由THUNLP、中国人民大学RUCBM和ModelBest联合开发的开源大语言模型智能体。它基于MiniCPM4.1 80亿参数基座模型构建,接收用户指令作为输入,可自主生成长篇报告。Python00