Keras NLP v0.20.0 版本发布：文本与视觉模型全面升级

2025-07-09 11:47:02作者：廉彬冶Miranda

Modular Natural Language Processing workflows with Keras

项目地址：https://gitcode.com/gh_mirrors/ke/keras-nlp

Keras NLP 是 TensorFlow 生态系统中专注于自然语言处理任务的深度学习库，它构建在 Keras 核心之上，为开发者提供了高效、易用的 NLP 工具链。最新发布的 v0.20.0 版本带来了一系列重要的功能增强和模型更新，特别是在多模态模型和视觉文本联合处理方面取得了显著进展。

核心模型升级

1. SigLIP 系列模型引入

SigLIP（Sigmoid Loss for Language-Image Pretraining）是一种创新的视觉语言模型，它通过改进的损失函数显著提升了图像-文本匹配任务的性能。v0.20.0 版本不仅引入了基础 SigLIP 模型，还新增了 SigLIP2 这一更强大的变体。这些模型特别适合：

跨模态检索任务
图像描述生成
视觉问答系统

2. Gemma 模型家族扩展

Gemma 是 Google 推出的轻量级开源大语言模型系列，本次更新带来了两个重要改进：

Gemma3 的加入：提供更强的语言理解和生成能力
视觉适配：为 Gemma3 增加了视觉处理能力，使其能够处理图像输入
TPU 优化：改进了注意力机制实现，特别优化了在 TPU 上的运行效率

3. CSPNet 架构支持

CSPNet（Cross Stage Partial Network）是一种高效的卷积神经网络架构，特别适合边缘设备部署。新版本中增加了对 CSPNet 的支持，主要特点包括：

跨阶段部分连接设计，减少计算冗余
轻量化结构，适合移动端和嵌入式设备
在保持精度的同时显著降低计算成本

技术优化与改进

1. 训练基础设施增强

LoRA 目标选择：现在可以更精确地指定 LoRA（Low-Rank Adaptation）微调的目标层，提高了参数效率微调的灵活性
注意力机制优化：改进了滑动窗口注意力在 Gemma 模型中的实现顺序，提升了计算效率
Flash Attention 支持：增加了对支持 GPU 的自动检测，优化了内存使用

2. 预处理与数据管道

文本到图像预处理基类：新增了 TextToImagePreprocessor 基类，为标准化的多模态预处理流程提供了统一接口
图像转换器修复：解决了图像数据类型处理中的潜在问题，提高了数据管道的鲁棒性

3. 模型部署优化

TensorFlow Text 依赖管理：现在只在非 Windows 平台安装 TF Text，解决了部分环境下的兼容性问题
预设路径更新：调整了 Kaggle 和 HuggingFace 模型预设的存储路径，提高了模型加载的可靠性

开发者体验提升

贡献指南更新：完善了项目贡献文档，为新开发者提供了更清晰的指引
代码质量工具：将 pre-commit 检查加入公共需求文件，统一了开发环境配置
版本管理改进：优化了开发版本和发布版本的标记规则

应用场景建议

基于 v0.20.0 的新特性，以下是一些推荐的应用方向：

多模态应用开发：结合 SigLIP 和 Gemma3 的视觉能力，可以构建强大的图像-文本联合处理系统
边缘设备部署：利用 CSPNet 和优化后的 MobileNet 预设，开发高效的移动端视觉应用
参数高效微调：通过增强的 LoRA 功能，可以低成本地适配大语言模型到特定领域

这个版本标志着 Keras NLP 在多模态处理和模型效率方面迈出了重要一步，为开发者提供了更强大、更灵活的工具集来构建下一代 NLP 和视觉语言应用。

Modular Natural Language Processing workflows with Keras

项目地址：https://gitcode.com/gh_mirrors/ke/keras-nlp

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理