首页
/ Keras 3.10.0版本发布:新增权重分片与多项功能增强

Keras 3.10.0版本发布:新增权重分片与多项功能增强

2025-05-31 08:20:52作者:郁楠烈Hubert

Keras作为深度学习领域广受欢迎的高级神经网络API,在最新发布的3.10.0版本中带来了多项重要更新。本次更新不仅解决了大规模模型存储的痛点问题,还引入了新的优化器、损失函数、预处理层以及多项运算支持,进一步提升了框架的实用性和灵活性。

核心特性解析

权重分片存储功能

针对大型模型存储这一常见痛点,3.10.0版本新增了权重分片支持。通过model.save()方法的max_shard_size参数,开发者可以指定权重文件的最大分片大小,系统会自动将模型权重分割为不超过该大小的多个文件块。这一特性特别适合存储参数规模庞大的模型,有效解决了单一大文件带来的存储和传输问题。

加载分片存储的模型同样简单,只需使用常规的load_model()函数即可自动重组所有分片。这一改进使得Keras在处理超大规模模型时更加游刃有余。

新增Muon优化器

本次更新引入了全新的Muon优化器,为模型训练提供了更多选择。Muon优化器在特定任务上可能展现出优于传统优化器的性能表现,开发者可以根据具体场景进行测试和选用。

图像处理增强

新增的RandomElasticTransform预处理层为图像数据增强提供了新工具。该层能够对输入图像施加随机弹性变换,模拟真实世界中的形变效果,有助于提升模型的泛化能力。同时新增的elastic_transform操作也为开发者提供了更底层的弹性变换控制能力。

损失函数与激活函数扩展

3.10.0版本丰富了损失函数体系,新增了CategoricalGeneralizedCrossEntropy及其函数式版本。这一损失函数为分类任务提供了更多选择,特别适合需要特殊处理类别不平衡的场景。

同时,SparseCategoricalCrossentropy损失函数新增了axis参数,提供了更灵活的计算维度控制。新增的sparse_sigmoid激活函数则为特定网络结构设计提供了更多可能。

LoRA技术增强

低秩适应(LoRA)技术在3.10.0版本中得到了增强,所有支持LoRA的层都新增了lora_alpha参数。该参数用于缩放前向传播过程中的低秩适应增量,为模型微调提供了更精细的控制手段。

运算能力扩展

本次更新增加了多项数学运算支持,包括:

  • 复数处理:angleview_as_complexview_as_real
  • 窗函数:bartlettblackmanhamming

这些新运算为信号处理、频域分析等专业领域提供了更好的支持。

后端优化

PyTorch后端改进

新增了cuDNN对LSTM的支持,显著提升了在PyTorch后端上运行LSTM模型的效率。

TensorFlow后端增强

  • 支持tf.RaggedTensor作为Embedding层的输入
  • 新增变量级别的synchronization参数支持

OpenVINO推理后端

OpenVINO推理后端新增了对50多个Keras运算的支持,大大扩展了在该后端上可运行的模型范围。

总结

Keras 3.10.0版本通过权重分片存储、新增优化器与损失函数、扩展运算能力等多方面改进,进一步巩固了其作为深度学习首选框架的地位。特别是权重分片功能的加入,解决了大型模型存储的实际问题;而各项新特性和后端优化则为不同应用场景提供了更多可能。这些更新使得Keras在保持易用性的同时,能够更好地满足专业开发者和研究人员的需求。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
23
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
225
2.27 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
flutter_flutterflutter_flutter
暂无简介
Dart
526
116
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
987
583
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
351
1.42 K
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
61
17
GLM-4.6GLM-4.6
GLM-4.6在GLM-4.5基础上全面升级:200K超长上下文窗口支持复杂任务,代码性能大幅提升,前端页面生成更优。推理能力增强且支持工具调用,智能体表现更出色,写作风格更贴合人类偏好。八项公开基准测试显示其全面超越GLM-4.5,比肩DeepSeek-V3.1-Terminus等国内外领先模型。【此简介由AI生成】
Jinja
47
0
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
17
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
JavaScript
212
287