Keras NLP项目v0.20.0.dev0版本技术解析

2025-07-09 10:10:49作者：卓炯娓

Modular Natural Language Processing workflows with Keras

项目地址：https://gitcode.com/gh_mirrors/ke/keras-nlp

Keras NLP是Keras团队推出的自然语言处理工具库，它建立在Keras框架之上，为开发者提供了丰富的预训练模型和高效的NLP工具。本次发布的v0.20.0.dev0版本带来了多项重要更新，包括新模型的加入、性能优化以及功能增强。

核心模型更新

SigLIP系列模型引入

本次更新新增了SigLIP和SigLIP2两种视觉语言模型。SigLIP（Sigmoid Language-Image Pretraining）是一种创新的视觉语言预训练方法，它通过sigmoid交叉熵损失函数替代传统的softmax交叉熵，显著提升了模型在零样本分类任务上的性能。SigLIP2则是在此基础上的改进版本，进一步优化了模型架构和训练策略。

Gemma模型升级

Gemma系列模型迎来了重要更新：

新增Gemma3模型，这是Google最新推出的大型语言模型，在多个基准测试中表现出色
针对TPU环境优化了Gemma的注意力机制实现
调整了滑动窗口注意力在模型中的位置，使其位于FA（Flash Attention）块之前，提升了计算效率
为Gemma3添加了视觉能力支持，使其能够处理多模态任务

Qwen 2.5模型

虽然最终版本中暂时移除了Qwen 2.5的导出功能，但这一更新表明Keras NLP正在积极整合最新的开源大模型。Qwen（通义千问）是阿里云开发的大型语言模型系列，2.5版本在推理能力和多语言支持上有所增强。

架构优化与功能改进

注意力机制增强

针对不同硬件平台优化了注意力实现，特别是对TPU和GPU的支持
更新了Flash Attention的门控条件，确保在支持的GPU上能够正确启用这一高效注意力实现

模型训练工具

扩展了LoRA（Low-Rank Adaptation）的目标层选择功能，开发者现在可以更灵活地指定需要应用LoRA的层
新增了TextToImagePreprocessor基类，为文本到图像模型的预处理提供了统一接口

移动端优化

新增了MobileNet的前3个HuggingFace预设配置，使开发者能够更方便地在移动设备上部署轻量级视觉模型。

开发者体验提升

修复了图像转换器中的数据类型错误，提高了模型输入的兼容性
更新了贡献指南和预提交检查流程，使社区贡献更加规范
完善了开发环境配置，将pre-commit工具加入公共依赖文件

技术前瞻

从本次更新可以看出Keras NLP的几个发展方向：

多模态能力增强：通过SigLIP和Gemma3 Vision的加入，库正在扩展对视觉语言任务的支持
硬件适配优化：特别关注TPU和不同GPU架构的性能调优
最新模型整合：积极跟进业界最新模型发展，如Gemma3和Qwen等

这个预发布版本为开发者提供了丰富的工具和模型选择，特别是在多模态和大型语言模型支持方面有了显著进步。随着正式版本的临近，我们可以期待更稳定和高效的NLP开发体验。

Modular Natural Language Processing workflows with Keras

项目地址：https://gitcode.com/gh_mirrors/ke/keras-nlp

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理