TensorFlow Text 2.19.0版本发布：多架构支持与依赖管理优化

2025-07-03 07:00:28作者：贡沫苏Truman

TensorFlow Text是TensorFlow生态系统中的一个重要组件，专门为自然语言处理任务提供文本处理功能。作为TensorFlow的扩展库，它包含了多种文本预处理工具和操作符，能够高效地处理各种文本数据。

多架构支持与Docker构建

本次2.19.0版本的一个显著改进是增加了对多架构的支持，特别是添加了aarch64架构的pip轮子文件。这意味着现在可以在基于ARM架构的设备上更便捷地安装和使用TensorFlow Text。

项目还新增了Docker构建脚本，这将为开发者提供更加一致的构建环境，简化了在不同平台上构建TensorFlow Text的过程。Docker容器化构建能够确保开发环境的一致性，减少因环境差异导致的问题。

依赖管理与版本兼容性

在依赖管理方面，本次更新做了多项重要调整：

将dm-tree依赖限制在0.1.8版本，这有助于避免因依赖版本过高导致的兼容性问题
显式添加了tf-keras依赖，明确了与Keras的关系
修复了protobuf依赖问题，确保协议缓冲区功能的稳定性
添加了numpy作为Python依赖，并修复了其他Python依赖关系

这些改动使得TensorFlow Text的依赖关系更加清晰和稳定，减少了因依赖冲突导致的问题。

代码质量与测试改进

在代码质量方面，本次更新包含多项改进：

使用Mypy 1.13.0重新生成类型存根文件，提高了代码的类型检查准确性
清理了已弃用的测试方法，使测试套件更加现代化
移除了不必要的srcs_version和python_version属性，简化了构建配置
删除了无效的public_names_test，优化了测试结构

Unicode处理改进

本次更新特别处理了不同Unicode版本间标点符号定义的差异问题。文本处理库需要精确识别各种标点符号，而Unicode标准会随着版本更新而调整标点符号的定义。这一改进确保了TensorFlow Text在不同Unicode环境下都能正确处理文本中的标点符号。

构建系统优化

构建系统方面也有多项改进：

将核心内核中过时的select()调用替换为平台API等效实现
更新了测试文件以适应新版本的ICU（International Components for Unicode）库
添加了必要的构建依赖项，如absl_py

这些改动使得TensorFlow Text的构建过程更加现代化和可靠。

版本更新与发布管理

本次发布经历了从2.19.0-rc0到最终2.19.0的版本迭代过程，期间对版本后缀存储库配置进行了调整和回滚，最终确定了稳定的发布版本。版本管理是开源项目的重要环节，这些改动反映了团队对发布质量的严格把控。

结语

TensorFlow Text 2.19.0版本在多架构支持、依赖管理、代码质量和构建系统等方面都有显著改进。这些变化不仅提升了库的稳定性和兼容性，也为开发者提供了更好的使用体验。特别是对ARM架构的官方支持，将使得在更多设备上部署NLP应用成为可能。

text

Making text a first-class citizen in TensorFlow.

项目地址：https://gitcode.com/gh_mirrors/tex/text

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

392

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.67 K

987