PML-Book中泛化误差估计公式的修正与解析

2025-06-08 04:01:19作者：邓越浪Henry

在机器学习模型评估过程中，准确估计模型的泛化误差是至关重要的。近期，概率机器学习经典教材PML-Book对泛化误差估计公式进行了重要修正，这一改动不仅纠正了原有公式的符号问题，更准确地区分了训练误差和测试误差的关系。

原公式存在的问题

原书中公式5.84试图表达模型在训练集和测试集上表现的差异，即泛化误差。然而该公式存在两个主要问题：

符号方向错误：测试误差通常高于训练误差，导致原公式右侧计算结果为负值，这与泛化误差应为正值的直观理解相矛盾
概念定义不准确：原公式将"泛化误差"定义为真实风险与最优风险之差，但实际应用中更关注的是训练风险与真实风险的差异

修正后的公式体系

经过修正后，书中现在明确定义了三个关键概念：

训练误差：模型在训练集上的平均损失
测试误差：模型在独立测试集上的平均损失
泛化误差：训练误差与真实风险（期望风险）之差

修正后的公式体系更清晰地表达了这些概念之间的关系：

泛化误差 = 训练误差 - 真实风险
估计的泛化误差 ≈ 训练误差 - 测试误差

理论意义与实践价值

这一修正具有重要的理论和实践意义：

概念清晰化：明确区分了真实风险（不可观测）和测试误差（可观测）的不同
估计合理性：确保泛化误差估计值为正，符合"训练误差通常低于真实风险"的认知
模型评估：为实际应用中评估模型过拟合程度提供了更准确的数学表达

在实际机器学习项目中，这一修正帮助从业者更准确地：

评估模型在未知数据上的表现
判断模型是否存在过拟合
比较不同模型的泛化能力

对机器学习实践的影响

理解泛化误差的正确计算方式对机器学习实践有深远影响：

模型选择：基于准确的泛化误差估计，可以选择真正具有良好泛化能力的模型
正则化调整：通过观察泛化误差的变化，可以更合理地调整正则化强度
早停策略：在训练过程中监控泛化误差估计，可以确定最佳停止训练时机

这一修正体现了机器学习理论研究中概念精确化的重要性，也为实践中的模型评估提供了更可靠的理论基础。

pml-book

"Probabilistic Machine Learning" - a book series by Kevin Murphy

项目地址：https://gitcode.com/gh_mirrors/pm/pml-book

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

203

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

apinto

基于golang开发的网关。具有各种插件，可以自行扩展，即插即用。此外，它可以快速帮助企业管理API服务，提高API服务的稳定性和安全性。