Keras 3.9.0版本发布:新增多项深度学习功能与安全增强
Keras作为深度学习领域广受欢迎的高层神经网络API,其最新3.9.0版本带来了多项重要更新。Keras以其简洁易用的接口设计,让开发者能够快速构建和训练深度学习模型,同时支持TensorFlow、JAX和PyTorch等多种后端框架。本次更新不仅增强了模型训练的性能优化能力,还引入了多种实用的新层和操作,同时解决了潜在的安全问题。
核心功能更新
精细化重计算API
3.9.0版本引入了全新的重计算(rematerialization)API:keras.RematScope
和keras.remat
。这项技术对于大型模型训练尤为重要,它允许开发者在细粒度层面上控制哪些层的激活值需要被重新计算而非存储,从而在内存和计算之间取得平衡。
重计算技术特别适用于以下场景:
- 仅对超过特定大小的层启用重计算
- 针对特定层组应用重计算
- 仅对激活值进行重计算
这种精细化的控制方式使得开发者能够更灵活地优化模型训练过程,在有限的内存资源下训练更大的模型。
新增层类型
本次更新丰富了Keras的层类型库,增加了多个实用层:
-
RMSNormalization层:实现了均方根归一化,为模型训练提供更稳定的梯度流。
-
数据增强层:
- AugMix:通过混合多个增强图像来提升模型鲁棒性
- CutMix:采用区域混合策略增强数据
- RandomInvert:随机反转图像颜色
- RandomErasing:随机擦除图像区域
- RandomGaussianBlur:应用随机高斯模糊
- RandomPerspective:添加随机透视变换
这些新增层极大地简化了计算机视觉任务中的数据增强流程,开发者可以直接将这些层集成到模型中,实现端到端的训练流程。
新增操作支持
Keras 3.9.0扩展了其操作集,新增了多个实用函数:
rot90
:实现张量旋转90度rearrange
:提供Einops风格的张量重排功能signbit
:判断数值符号位polar
:将复数转换为极坐标形式- 图像处理操作:
perspective_transform
:实现透视变换gaussian_blur
:应用高斯模糊
这些新增操作丰富了Keras的功能集,使开发者能够更方便地实现各种复杂的张量操作和图像处理任务。
功能增强与改进
-
OpenVINO后端支持增强:扩展了OpenVINO后端的操作覆盖范围,提升了在该后端下的模型兼容性。
-
JaxLayer和FlaxLayer改进:新增了对
dtype
参数的支持,增强了与JAX生态的互操作性。 -
BinaryAccuracy指标增强:现在支持布尔型输入,提高了该指标的使用灵活性。
-
Resizing层改进:新增
antialias
参数,优化了图像缩放时的抗锯齿处理。
安全增强
本次版本修复了一个重要的安全问题:禁止在保存的npz
模型文件(numpy格式)中进行对象序列化。这一改进防止了潜在的恶意代码执行风险,提升了模型文件的安全性。
开发者生态
Keras 3.9.0版本得到了社区开发者的广泛贡献,有14位新开发者首次为项目提交了代码。这种活跃的社区参与确保了Keras生态系统的持续健康发展。
总结
Keras 3.9.0版本通过引入重计算API、丰富层类型库、扩展操作集以及增强安全性,进一步巩固了其作为深度学习首选框架的地位。这些更新不仅提升了框架的功能性,也优化了开发者的使用体验,使得构建和训练深度学习模型更加高效和安全。对于从事计算机视觉、自然语言处理等AI领域的开发者来说,升级到3.9.0版本将能够利用这些新特性来提升模型性能和开发效率。
- DDeepSeek-V3.1-BaseDeepSeek-V3.1 是一款支持思考模式与非思考模式的混合模型Python00
- QQwen-Image-Edit基于200亿参数Qwen-Image构建,Qwen-Image-Edit实现精准文本渲染与图像编辑,融合语义与外观控制能力Jinja00
GitCode-文心大模型-智源研究院AI应用开发大赛
GitCode&文心大模型&智源研究院强强联合,发起的AI应用开发大赛;总奖池8W,单人最高可得价值3W奖励。快来参加吧~052CommonUtilLibrary
快速开发工具类收集,史上最全的开发工具类,欢迎Follow、Fork、StarJava04GitCode百大开源项目
GitCode百大计划旨在表彰GitCode平台上积极推动项目社区化,拥有广泛影响力的G-Star项目,入选项目不仅代表了GitCode开源生态的蓬勃发展,也反映了当下开源行业的发展趋势。06GOT-OCR-2.0-hf
阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00openHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!C0331- WWan2.2-S2V-14B【Wan2.2 全新发布|更强画质,更快生成】新一代视频生成模型 Wan2.2,创新采用MoE架构,实现电影级美学与复杂运动控制,支持720P高清文本/图像生成视频,消费级显卡即可流畅运行,性能达业界领先水平Python00
- GGLM-4.5-AirGLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量,其中 320 亿活跃参数;GLM-4.5-Air采用更紧凑的设计,拥有 1060 亿总参数量,其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力,以满足智能体应用的复杂需求Jinja00
Yi-Coder
Yi Coder 编程模型,小而强大的编程助手HTML013
热门内容推荐
最新内容推荐
项目优选









