Edibble项目教程:实验设计中的结构定义方法
引言
在农业科学和生物统计领域,设计合理的田间试验对研究结果的可信度至关重要。本文将介绍如何使用edibble包来定义实验设计的结构,特别聚焦于小麦田间试验的设计过程。edibble提供了一套直观且灵活的工具,帮助研究人员清晰地定义实验单元、处理因素及其相互关系。
实验设计初始化
任何edibble设计都从初始化设计对象开始。这相当于为整个实验建立一个容器,后续的所有设计元素都将添加至此。
design("小麦田间试验")
初始化时可以指定实验标题,这个信息将作为元数据保存在对象中,并在输出和导出文件时显示。
定义实验单元
基本单元定义
实验设计中最基本的元素是实验单元,使用set_units()函数定义。下面代码创建了包含4个试验地点的设计:
demo <- design("单元定义演示") %>%
set_units(地点 = 4)
单元水平默认会自动命名为"地点1"、"地点2"等。如果需要特定名称,可以直接提供字符向量:
design("指定名称的单元") %>%
set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西")) %>%
serve_table()
嵌套单元结构
田间试验通常具有层次结构。例如,每个地点可能包含多个小区。edibble使用nested_in()辅助函数定义这种嵌套关系:
design("嵌套结构演示") %>%
set_units(地点 = 4,
小区 = nested_in(地点, 18)) %>%
serve_table()
交叉单元结构
当实验单元以矩形阵列排列时(如行和列),可以使用crossed_by()定义交叉结构:
design("交叉结构演示") %>%
set_units(行 = 6,
列 = 3,
小区 = crossed_by(行, 列)) %>%
serve_table()
复杂单元结构
结合嵌套和交叉结构可以构建更复杂的实验设计。例如,四个地点,每个地点有3行6列的小区:
complex <- design("复杂结构") %>%
set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西"),
列 = nested_in(地点, 6),
行 = nested_in(地点, 3),
小区 = nested_in(地点, crossed_by(行, 列)))
serve_table(complex, label_nested = c(行, 列))
定义处理因素
基本处理定义
处理因素使用set_trts()定义。下面示例定义了三个处理因素:品种、肥料类型和施肥量:
factrt <- design("因子处理") %>%
set_trts(品种 = c("a", "b"),
肥料 = c("A", "B"),
施肥量 = c(0.5, 1, 2))
默认情况下,所有处理因素都是交叉的。可以使用trts_table()查看完整的处理组合:
trts_table(factrt)
条件处理结构
某些处理因素可能依赖于其他因素。例如,当不施肥时,施肥量应为0:
factrtc <- design("带对照的因子处理") %>%
set_trts(品种 = c("a", "b"),
肥料 = c("无", "A", "B"),
施肥量 = conditioned_on(肥料,
"无" ~ 0,
. ~ c(0.5, 1, 2)))
建立因素间关系
分配处理到单元
使用allot_trts()定义处理因素如何分配到实验单元:
alloted1 <- (complex + factrtc) %>%
allot_trts(肥料 ~ 行,
施肥量:品种 ~ 小区)
处理分配算法
edibble提供多种分配算法:
- "systematic":系统分配,处理水平按顺序分配到单元
- "systematic-random":随机化处理顺序后系统分配
- "random":完全随机分配
design1 <- alloted1 %>%
assign_trts(order = c("systematic", "random"),
seed = 2023) %>%
serve_table(label_nested = c(行, 列))
实际应用示例
假设我们需要设计一个小麦田间试验:
- 4个地点,其中2个地点有9列,其他有6列
- 3行每个地点
- 3个品种
- 2种肥料类型(含对照)
- 3种施肥量(对照时为0)
完整设计代码如下:
final_design <- design("小麦品种比较试验") %>%
# 定义单元结构
set_units(地点 = c("纳拉布里", "霍舍姆", "帕克斯", "罗斯沃西"),
列 = nested_in(地点,
c("纳拉布里", "罗斯沃西") ~ 9,
. ~ 6),
行 = nested_in(地点, 3),
小区 = nested_in(地点, crossed_by(行, 列))) %>%
# 定义处理因素
set_trts(品种 = c("A", "B", "C"),
肥料 = c("无", "X", "Y"),
施肥量 = conditioned_on(肥料,
"无" ~ 0,
. ~ c(0.5, 1, 2))) %>%
# 分配处理到单元
allot_trts(肥料 ~ 行,
施肥量:品种 ~ 小区) %>%
# 执行分配
assign_trts(order = c("systematic", "random"),
seed = 2023) %>%
# 生成设计表
serve_table(label_nested = c(行, 列))
总结
edibble提供了强大而灵活的工具来定义复杂的实验设计结构。通过本文介绍的方法,研究人员可以:
- 清晰地定义实验单元及其层次结构
- 准确地描述处理因素及其相互关系
- 灵活地控制处理分配到单元的方式
- 生成可直接用于分析的设计表格
这种结构化的设计方法不仅提高了实验设计的透明度,也为后续的统计分析奠定了良好基础。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00