UDLBook项目中的逻辑Sigmoid函数极限行为探讨

2025-05-30 16:25:20作者：翟江哲Frasier

Understanding Deep Learning - Simon J.D. Prince

项目地址：https://gitcode.com/gh_mirrors/ud/udlbook

函数极限的数学严谨性

在深度学习的数学基础中，逻辑Sigmoid函数是一个核心的激活函数，其定义为sig[z] = 1 / (1 + exp(-z))。初学者常会遇到关于函数在无穷远点行为的表述问题。严格来说，数学上应该使用极限的概念来描述函数在z趋向于正负无穷时的渐近行为，而不是直接代入无穷大值。

原问题表述的优化建议

原教材问题中使用了"当z=±∞时"的表述方式，这虽然简化了理解，但从数学严谨性角度存在两个潜在问题：

无穷大不是实数域中的数值，不能直接代入函数
忽略了极限过程的动态特性

更准确的表述应该采用极限语言：

lim_(z→-∞) sig[z] = 0
lim_(z→∞) sig[z] = 1

教学平衡的考量

在教材编写中，需要在数学严谨性和教学可读性之间取得平衡：

直接使用z=±∞的表述降低了理解门槛
但可能掩盖了极限过程的重要概念
理想做法是逐步引入严格定义，同时保持直观解释

Sigmoid函数的概率解释

Sigmoid函数的极限行为保证了其输出始终在(0,1)区间内，这一特性使其成为：

二分类问题中理想的概率输出函数
神经网络最后一层的理想激活函数
逻辑回归模型的核心组成部分

改进建议的技术内涵

提出的改进表述不仅修正了数学表述，还强化了以下概念：

函数渐近行为的动态过程
激活函数的饱和特性
深度学习中的概率建模基础

这种表述方式既保持了数学正确性，又为后续学习更复杂的激活函数（如tanh、softmax）奠定了概念基础。

Understanding Deep Learning - Simon J.D. Prince

项目地址：https://gitcode.com/gh_mirrors/ud/udlbook

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统