Edibble项目教程:实验设计中的结构定义方法
引言
在农业科学和生物统计领域,设计合理的田间试验对研究结果的可信度至关重要。本文将介绍如何使用edibble包来定义实验设计的结构,特别聚焦于小麦田间试验的设计过程。edibble提供了一套直观且灵活的工具,帮助研究人员清晰地定义实验单元、处理因素及其相互关系。
实验设计初始化
任何edibble设计都从初始化设计对象开始。这相当于为整个实验建立一个容器,后续的所有设计元素都将添加至此。
design("小麦田间试验")
初始化时可以指定实验标题,这个信息将作为元数据保存在对象中,并在输出和导出文件时显示。
定义实验单元
基本单元定义
实验设计中最基本的元素是实验单元,使用set_units()函数定义。下面代码创建了包含4个试验地点的设计:
demo <- design("单元定义演示") %>%
set_units(地点 = 4)
单元水平默认会自动命名为"地点1"、"地点2"等。如果需要特定名称,可以直接提供字符向量:
design("指定名称的单元") %>%
set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西")) %>%
serve_table()
嵌套单元结构
田间试验通常具有层次结构。例如,每个地点可能包含多个小区。edibble使用nested_in()辅助函数定义这种嵌套关系:
design("嵌套结构演示") %>%
set_units(地点 = 4,
小区 = nested_in(地点, 18)) %>%
serve_table()
交叉单元结构
当实验单元以矩形阵列排列时(如行和列),可以使用crossed_by()定义交叉结构:
design("交叉结构演示") %>%
set_units(行 = 6,
列 = 3,
小区 = crossed_by(行, 列)) %>%
serve_table()
复杂单元结构
结合嵌套和交叉结构可以构建更复杂的实验设计。例如,四个地点,每个地点有3行6列的小区:
complex <- design("复杂结构") %>%
set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西"),
列 = nested_in(地点, 6),
行 = nested_in(地点, 3),
小区 = nested_in(地点, crossed_by(行, 列)))
serve_table(complex, label_nested = c(行, 列))
定义处理因素
基本处理定义
处理因素使用set_trts()定义。下面示例定义了三个处理因素:品种、肥料类型和施肥量:
factrt <- design("因子处理") %>%
set_trts(品种 = c("a", "b"),
肥料 = c("A", "B"),
施肥量 = c(0.5, 1, 2))
默认情况下,所有处理因素都是交叉的。可以使用trts_table()查看完整的处理组合:
trts_table(factrt)
条件处理结构
某些处理因素可能依赖于其他因素。例如,当不施肥时,施肥量应为0:
factrtc <- design("带对照的因子处理") %>%
set_trts(品种 = c("a", "b"),
肥料 = c("无", "A", "B"),
施肥量 = conditioned_on(肥料,
"无" ~ 0,
. ~ c(0.5, 1, 2)))
建立因素间关系
分配处理到单元
使用allot_trts()定义处理因素如何分配到实验单元:
alloted1 <- (complex + factrtc) %>%
allot_trts(肥料 ~ 行,
施肥量:品种 ~ 小区)
处理分配算法
edibble提供多种分配算法:
- "systematic":系统分配,处理水平按顺序分配到单元
- "systematic-random":随机化处理顺序后系统分配
- "random":完全随机分配
design1 <- alloted1 %>%
assign_trts(order = c("systematic", "random"),
seed = 2023) %>%
serve_table(label_nested = c(行, 列))
实际应用示例
假设我们需要设计一个小麦田间试验:
- 4个地点,其中2个地点有9列,其他有6列
- 3行每个地点
- 3个品种
- 2种肥料类型(含对照)
- 3种施肥量(对照时为0)
完整设计代码如下:
final_design <- design("小麦品种比较试验") %>%
# 定义单元结构
set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西"),
列 = nested_in(地点,
c("纳拉布里", "罗斯沃西") ~ 9,
. ~ 6),
行 = nested_in(地点, 3),
小区 = nested_in(地点, crossed_by(行, 列))) %>%
# 定义处理因素
set_trts(品种 = c("A", "B", "C"),
肥料 = c("无", "X", "Y"),
施肥量 = conditioned_on(肥料,
"无" ~ 0,
. ~ c(0.5, 1, 2))) %>%
# 分配处理到单元
allot_trts(肥料 ~ 行,
施肥量:品种 ~ 小区) %>%
# 执行分配
assign_trts(order = c("systematic", "random"),
seed = 2023) %>%
# 生成设计表
serve_table(label_nested = c(行, 列))
总结
edibble提供了强大而灵活的工具来定义复杂的实验设计结构。通过本文介绍的方法,研究人员可以:
- 清晰地定义实验单元及其层次结构
- 准确地描述处理因素及其相互关系
- 灵活地控制处理分配到单元的方式
- 生成可直接用于分析的设计表格
这种结构化的设计方法不仅提高了实验设计的透明度,也为后续的统计分析奠定了良好基础。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0138- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
MiniCPM-V-4.6这是 MiniCPM-V 系列有史以来效率与性能平衡最佳的模型。它以仅 1.3B 的参数规模,实现了性能与效率的双重突破,在全球同尺寸模型中登顶,全面超越了阿里 Qwen3.5-0.8B 与谷歌 Gemma4-E2B-it。Jinja00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00
MusicFreeDesktop插件化、定制化、无广告的免费音乐播放器TypeScript00