distributions3项目中的双样本Z检验详解
前言
在统计学中,Z检验是一种常用的假设检验方法,用于比较样本均值与总体均值或两个样本均值之间的差异。本文将基于distributions3项目中的双样本Z检验案例,详细介绍其原理、实现步骤和实际应用。
案例背景
假设一位学生想研究生物学教授和英语教授谁更了解网络流行文化(memes)。为此,该学生设计了一份meme知识测试问卷,并分别对14位生物学教授和18位英语教授进行了测试。
生物学教授得分如下: 3, 7, 11, 0, 7, 0, 4, 5, 6, 2, 4, 7, 2, 9
英语教授得分如下: 5, 5, 4, 5, 4, 5, 7, 2, 6, 2, 2, 7, 2, 6, 4, 2, 5, 2
已知生物学教授得分的总体方差σ²₁=3,英语教授得分的总体方差σ²₂=2。
正态性检验
在进行Z检验前,我们需要确认样本均值是否服从正态分布。根据中心极限定理,当样本量足够大(通常认为n≥30)时,样本均值近似服从正态分布。但本例中两个样本量都小于30,因此需要进行正态性检验。
Q-Q图检验
我们使用正态分位数-分位数图(Q-Q图)来检验数据是否来自正态分布:
biology <- c(3, 7, 11, 0, 7, 0, 4, 5, 6, 2, 4, 7, 2, 9)
english <- c(8, 5, 4, 10, 4, 5, 7, 2, 6, 1, 2, 7, 0, 6, 4, 12, 5, 2)
qqnorm(biology)
qqline(biology)
qqnorm(english)
qqline(english)
从Q-Q图可以看出,两组数据点都基本落在参考线附近,没有明显的系统性偏离,因此可以认为两组数据都近似服从正态分布。
箱线图可视化
我们还可以使用箱线图直观比较两组数据:
library(ggplot2)
test_results <- data.frame(
score = c(biology, english),
department = c(
rep("biology", length(biology)),
rep("english", length(english))
)
ggplot(test_results, aes(x = department, y = score, color = department)) +
geom_boxplot() +
geom_jitter() +
scale_color_brewer(type = "qual", palette = 2) +
theme_minimal() +
theme(legend.position = "none")
从箱线图可以看出,两组数据的分布中心(中位数)和离散程度都比较接近,初步判断两组均值可能没有显著差异。
假设检验
建立假设
我们设定:
- 零假设H₀:μ₁ - μ₂ = 0(两组均值无差异)
- 备择假设H₁:μ₁ - μ₂ ≠ 0(两组均值有差异)
计算Z统计量
双样本Z检验的统计量公式为:
Z = (x̄₁ - x̄₂ - δ₀) / √(σ₁²/n₁ + σ₂²/n₂)
其中δ₀为假设的均值差(本例中为0),σ₁²和σ₂²为已知的总体方差,n₁和n₂为样本量。
在R中计算:
delta_0 <- 0
sigma_sq_1 <- 3
sigma_sq_2 <- 2
n_1 <- length(biology)
n_2 <- length(english)
z_stat <- (mean(biology) - mean(english) - delta_0) /
sqrt(sigma_sq_1 / n_1 + sigma_sq_2 / n_2)
计算得到的Z统计量约为-0.376。
p值计算
对于双侧检验,p值为P(|Z| ≥ |z_stat|)。使用distributions3包计算:
library(distributions3)
Z <- Normal(0, 1) # 标准正态分布
# 方法1
1 - cdf(Z, abs(z_stat)) + cdf(Z, -abs(z_stat))
# 方法2:利用对称性
2 * cdf(Z, -abs(z_stat))
两种方法得到的p值约为0.707,远大于常用的显著性水平0.05,因此不能拒绝零假设,即没有足够证据表明两组教授的meme知识水平存在显著差异。
单侧检验
有时我们可能需要进行单侧检验:
-
检验生物学教授得分是否显著高于英语教授: H₀: μ₁ ≤ μ₂ vs H₁: μ₁ > μ₂ p值 = P(Z > z_stat) = 1 - cdf(Z, z_stat)
-
检验生物学教授得分是否显著低于英语教授: H₀: μ₁ ≥ μ₂ vs H₁: μ₁ < μ₂ p值 = P(Z < z_stat) = cdf(Z, z_stat)
实际应用中的注意事项
-
方差已知:Z检验要求总体方差已知,这在实际情况中比较少见。如果方差未知,应该使用t检验。
-
样本独立性:两个样本必须相互独立,不能是配对或相关样本。
-
正态性假设:当样本量较小时,需要验证数据是否来自正态分布;样本量大时(n≥30),根据中心极限定理可放宽此要求。
-
效应量:除了p值,还应考虑差异的实际大小(效应量),这有助于判断差异的实际意义。
总结
通过distributions3项目中的双样本Z检验案例,我们学习了如何:
- 进行正态性检验
- 建立统计假设
- 计算Z统计量
- 计算并解释p值
- 区分双侧和单侧检验
在实际研究中,当满足Z检验的前提条件时,它是一种简单有效的均值比较方法。但需要注意检查假设条件,并根据研究问题选择合适的检验类型(单侧/双侧)。
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
unified-cache-managementUnified Cache Manager(推理记忆数据管理器),是一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理并持久化推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。Python03
MiniCPM-V-4_5MiniCPM-V 4.5 是 MiniCPM-V 系列中最新且功能最强的模型。该模型基于 Qwen3-8B 和 SigLIP2-400M 构建,总参数量为 80 亿。与之前的 MiniCPM-V 和 MiniCPM-o 模型相比,它在性能上有显著提升,并引入了新的实用功能Python00
HunyuanWorld-Mirror混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00
MiniMax-M2MiniMax-M2是MiniMaxAI开源的高效MoE模型,2300亿总参数中仅激活100亿,却在编码和智能体任务上表现卓越。它支持多文件编辑、终端操作和复杂工具链调用Python00
Spark-Scilit-X1-13B科大讯飞Spark Scilit-X1-13B基于最新一代科大讯飞基础模型,并针对源自科学文献的多项核心任务进行了训练。作为一款专为学术研究场景打造的大型语言模型,它在论文辅助阅读、学术翻译、英语润色和评论生成等方面均表现出色,旨在为研究人员、教师和学生提供高效、精准的智能辅助。Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile014
Spark-Chemistry-X1-13B科大讯飞星火化学-X1-13B (iFLYTEK Spark Chemistry-X1-13B) 是一款专为化学领域优化的大语言模型。它由星火-X1 (Spark-X1) 基础模型微调而来,在化学知识问答、分子性质预测、化学名称转换和科学推理方面展现出强大的能力,同时保持了强大的通用语言理解与生成能力。Python00- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00