MLX框架v0.22.0版本发布：跨语言函数导出与核心功能增强

2025-06-01 06:59:15作者：裘晴惠Vivianne

MLX是苹果推出的一个专为机器学习设计的轻量级框架，它能够充分利用苹果芯片的硬件加速能力。该框架支持Python和C++两种编程语言，并提供了从基础数学运算到高级神经网络构建的全套工具链。最新发布的v0.22.0版本带来了多项重要更新，特别是在跨语言互操作性、核心功能增强和性能优化方面。

跨语言函数导出与导入

本次更新最引人注目的特性是新增了MLX函数的跨语言导出与导入功能。开发者现在可以将Python中定义的MLX函数序列化保存到文件中，然后在C++环境中加载执行，反之亦然。这一特性为混合语言开发环境提供了极大的便利，使得Python的快速原型设计与C++的高性能部署能够无缝衔接。

在实际应用中，这一功能特别适合以下场景：

研究团队使用Python快速迭代模型设计，然后由工程团队将训练好的模型导出到C++生产环境
需要将Python实现的复杂预处理逻辑嵌入到C++应用程序中
跨团队协作时，不同语言背景的开发者可以共享MLX计算逻辑

核心功能增强

新版本对MLX的核心功能进行了多项重要扩展：

数组切片操作增强：新增了slice和slice_update函数，支持使用数组指定切片起始位置，提供了更灵活的数组操作能力。
形状处理工具：引入了Flatten、Unflatten和ExpandDims等基本形状变换操作原语，简化了张量形状处理流程。
数值精度控制：新增mx.finfo函数，用于查询浮点类型的数值特性，帮助开发者更好地控制数值精度。
负步长支持：slice和as_strided操作现在支持负步长而无需额外复制数据，提高了内存效率。
Kronecker积运算：新增mx.kron函数实现Kronecker积运算，丰富了线性代数运算工具集。

性能优化与改进

v0.22.0版本包含多项性能优化措施：

融合注意力机制改进：生成任务中的融合注意力现在支持布尔掩码，同时减少了内存拷贝操作，提升了大规模语言模型推理效率。
量化运算优化：修复了qmv/qvm运算在batch size为2-5时的性能问题，确保小批量处理也能获得最佳性能。
编译优化：扩展了无形状编译支持的原语列表，使得更多运算可以在编译时进行优化。
内存管理：修复了多个内存泄漏问题，并增加了对超出最大缓冲区数量的错误检测。

神经网络模块更新

神经网络相关模块也有重要改进：

优化器增强：Adam和AdamW优化器现在支持可选偏差校正，提高了训练稳定性。
混合量化支持：nn.quantize现在支持混合精度量化，为模型压缩提供了更多灵活性。
嵌入层优化：移除了nn.QuantizedEmbedding中不必要的reshape操作，简化了计算图。

平台兼容性提升

新版本显著改善了跨平台支持：

Linux/x86_64增强：多项改进提升了在Linux/x86_64平台上的使用体验。
Windows支持：通过一系列修复和改进，大大增强了Windows平台的支持度。
Metal框架更新：升级到新版Metal-cpp，提升了在苹果硬件上的图形计算性能。

错误修复与稳定性

v0.22.0版本修复了多个关键问题：

修复了transformer后归一化层的实现问题
解决了字符串常量在编译时哈希处理的缺陷
修正了Metal后端中小规模排序操作的错误
修复了连接/切片更新操作在输入类型不同时的梯度计算问题

这些改进使得MLX框架更加稳定可靠，适合用于生产环境部署。

总结

MLX v0.22.0版本通过引入跨语言函数导出、增强核心功能、优化性能和改进平台兼容性，进一步巩固了其作为苹果生态系统中高效机器学习框架的地位。特别是跨语言互操作性功能的加入，为开发者提供了更大的灵活性，使得从研究到部署的流程更加顺畅。随着量化支持和注意力机制等关键组件的持续优化，MLX正在成为在苹果硬件上部署高效机器学习模型的有力选择。

mlx

MLX：一个用于苹果硅芯片的数组框架。

项目地址：https://gitcode.com/GitHub_Trending/ml/mlx

登录后查看全文