Keras 3.9.0版本发布：新增重计算API与丰富图像增强层

2025-05-31 14:21:47作者：翟萌耘Ralph

Keras 3 是一个深度学习框架，支持 JAX、TensorFlow 和 PyTorch 多后端。轻松构建和训练图像识别、自然语言处理、音频处理等模型。加速开发流程，利用易于调试的运行时环境。实现最先进的性能，某些情况下比其他框架快 20% 至 350%。兼容从笔记本到大规模 GPU 或 TPU 集群的训练。已有近三百万开发者，包括初创企业和全球企业，信赖并使用 Keras 3。通过 `pip install keras` 即可安装，选择所需后端，开始您的高效深度学习之旅！

项目地址：https://gitcode.com/gh_mirrors/ker/keras

Keras作为深度学习领域广受欢迎的高层神经网络API，近期发布了3.9.0版本更新。本次更新不仅带来了性能优化相关的重计算（Rematerialization）API，还新增了多项实用的图像增强层和数学运算操作，进一步丰富了深度学习模型构建的工具箱。

核心特性解析

1. 精细化重计算控制

新版本引入了keras.RematScope和keras.rematAPI，为模型训练过程中的内存优化提供了更精细的控制手段。重计算技术通过牺牲部分计算性能来减少内存占用，特别适用于大模型训练场景。

开发者现在可以：

仅对特定大小的层启用重计算
针对选定的层集合应用该技术
选择性重计算激活值

这一改进使得内存优化策略能够更加精准地适配模型架构特点，在内存受限环境下训练更大模型成为可能。

2. 图像增强层扩展

3.9.0版本显著扩充了图像处理能力，新增多个实用增强层：

AugMix和CutMix：实现先进的图像混合增强技术
RandomInvert：随机颜色反转增强
RandomErasing：随机区域擦除增强
RandomGaussianBlur：随机高斯模糊处理
RandomPerspective：随机透视变换增强

这些层的加入使得开发者能够更方便地构建鲁棒的计算机视觉模型，特别是在数据量有限的情况下，通过多样化的数据增强提升模型泛化能力。

3. 数学运算增强

基础运算能力得到扩展，新增：

rot90：矩阵旋转操作
rearrange：Einops风格张量重组
signbit和polar：复数运算支持
图像专用的perspective_transform和gaussian_blur操作

这些底层运算的丰富为自定义层和复杂模型构建提供了更强大的基础支持。

其他重要改进

模型安全：修复了NPZ格式模型文件可能存在的对象反序列化问题，增强了模型存储安全性。
跨框架支持：优化了JaxLayer和FlaxLayer的dtype参数支持，提升了跨框架兼容性。
性能优化：OpenVINO后端增加了更多算子支持，提升了在该平台上的运行效率。
易用性改进：
- BinaryAccuracy指标现在支持布尔型输入
- Resizing层新增antialias抗锯齿参数
- 新增RMSNormalization层

技术影响与应用建议

本次更新中重计算API的引入对大规模模型训练具有重要意义。开发者可以针对模型特点设计精细化的内存优化策略，例如：

对大型Transformer层启用重计算
保持小型全连接层的原始计算方式
仅对特定瓶颈层应用该技术

图像增强层的丰富使得计算机视觉领域的迁移学习和少样本学习更加便利。建议开发者：

组合使用多种增强技术提升数据多样性
通过AugMix和CutMix实现先进的混合增强策略
利用RandomPerspective增强模型对视角变化的鲁棒性

数学运算的扩展为自定义层开发提供了更多可能性，特别是在信号处理和复数运算领域。新加入的rearrange操作特别适合需要复杂张量重排的场景，可以替代传统的转置和重塑操作，使代码更加清晰易读。

Keras 3.9.0通过这一系列更新，进一步巩固了其作为深度学习首选工具库的地位，特别是在模型构建灵活性和训练优化方面提供了更多专业级工具。

Keras 3 是一个深度学习框架，支持 JAX、TensorFlow 和 PyTorch 多后端。轻松构建和训练图像识别、自然语言处理、音频处理等模型。加速开发流程，利用易于调试的运行时环境。实现最先进的性能，某些情况下比其他框架快 20% 至 350%。兼容从笔记本到大规模 GPU 或 TPU 集群的训练。已有近三百万开发者，包括初创企业和全球企业，信赖并使用 Keras 3。通过 `pip install keras` 即可安装，选择所需后端，开始您的高效深度学习之旅！

项目地址：https://gitcode.com/gh_mirrors/ker/keras

登录后查看全文

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN开源社区的核心管理仓库，包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息

ohos_react_native

React Native鸿蒙化仓库