MLX-Swift 0.25.5版本发布：函数变换与激活函数增强

2025-07-05 07:38:03作者：庞队千Virginia

Swift API for MLX

项目地址：https://gitcode.com/gh_mirrors/ml/mlx-swift

项目简介

MLX-Swift是苹果生态系统中一个重要的机器学习框架，它基于Swift语言构建，旨在为开发者提供高效、易用的机器学习工具。该项目特别针对苹果硬件进行了优化，能够充分利用M系列芯片的神经网络引擎，在Mac、iPhone和iPad等设备上实现高性能的机器学习计算。

版本亮点

最新发布的0.25.5版本带来了几项重要改进，主要集中在函数变换能力和激活函数扩展方面，这些改进进一步增强了框架的灵活性和功能性。

1. vmap函数变换支持

本次更新引入了对vmap函数的支持，这是一项重要的功能增强。vmap（vectorized map）是一种函数变换技术，它能够自动将函数向量化，使其能够批量处理输入数据。

在实际应用中，vmap可以显著简化代码并提高性能。例如，当需要对一个批量的输入数据应用相同的操作时，传统方法可能需要显式编写循环或使用其他批量处理机制。而有了vmap，开发者只需定义单个样本的处理逻辑，然后通过vmap自动将其扩展到批量处理。

这项功能特别适合深度学习中的批量数据处理场景，如神经网络的前向传播、梯度计算等操作。它不仅可以减少代码量，还能通过自动优化带来性能提升。

2. ReLU平方激活函数

另一个重要新增是ReLUSquared激活函数。ReLU（Rectified Linear Unit）及其变体是深度神经网络中最常用的激活函数之一。标准的ReLU定义为f(x) = max(0, x)，而ReLUSquared则在此基础上进行了平方运算，定义为f(x) = max(0, x)^2。

ReLUSquared结合了ReLU的稀疏激活特性和平方运算的非线性增强效果。与标准ReLU相比，它在正区间的梯度会随着输入增大而增强，这可以帮助模型在某些情况下更快地学习复杂模式。这种激活函数特别适合需要强非线性表达能力的网络结构。

3. 模块更新机制优化

本次更新还包含了对可选模块更新机制的修复。在机器学习框架中，模块的灵活更新是构建动态网络结构的关键。优化后的更新机制能够更可靠地处理模块参数的可选性，提高了框架的稳定性和灵活性。

4. 文档改进

针对Xcode用户的README文档进行了修正，确保了包依赖管理的正确性。良好的文档对于开发者体验至关重要，这一改进有助于新用户更快地开始使用MLX-Swift。

技术意义

这些更新从不同层面增强了MLX-Swift的功能性：

性能优化：vmap的引入使得批量操作可以更高效地执行，充分利用硬件并行能力。
模型表达能力：新增的ReLUSquared激活函数为模型设计提供了更多选择，特别是在需要强非线性转换的场景。
开发体验：模块更新机制的改进和文档修正使得框架更加稳定和易用。

应用前景

这些新特性为多种机器学习应用场景带来了便利：

计算机视觉：vmap可以优化图像批处理流程，ReLUSquared可能提升某些视觉任务的模型性能。
自然语言处理：高效的批量处理对于处理变长序列数据尤为重要。
强化学习：灵活的模块更新机制有助于实现复杂的策略网络。

总结

MLX-Swift 0.25.5版本通过引入vmap函数变换和ReLUSquared激活函数，显著增强了框架的功能性和灵活性。这些改进不仅提升了开发效率，还为模型性能优化提供了新的可能性。随着这些新特性的加入，MLX-Swift在苹果生态系统中的机器学习应用开发将变得更加高效和强大。

Swift API for MLX

项目地址：https://gitcode.com/gh_mirrors/ml/mlx-swift

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。