JAX v0.6.0 版本更新解析：性能优化与API演进

2025-06-01 16:11:03作者：翟萌耘Ralph

Composable transformations of Python+NumPy programs: differentiate, vectorize, JIT to GPU/TPU, and more

项目地址：https://gitcode.com/GitHub_Trending/ja/jax

JAX 是一个由 Google 开发的高性能数值计算库，它结合了 NumPy 的易用性与自动微分、硬件加速等高级功能。JAX 通过 XLA 编译器优化计算图，并支持在 GPU 和 TPU 上运行，特别适合机器学习和大规模科学计算场景。

重大变更与向后兼容性调整

本次 JAX v0.6.0 版本带来了多项重要变更，开发者需要特别注意这些变化对现有代码的影响：

数据类型处理更严格：jax.numpy.array 不再接受 None 值输入，这项变更自 2023 年 11 月起已被标记为废弃，现在正式移除。
配置选项精简：
- 移除了临时性的 config.jax_data_dependent_tracing_fallback 配置选项
- 移除了 config.jax_eager_pmap 配置选项
编译流程优化：对 lower 和 trace AOT API 的调用现在有更严格的限制，如果对 jax.jit 结果应用了后续包装器，将不再允许调用这些 API。开发者应确保 jax.jit 是最后应用的包装器。
CUDA 支持升级：JAX 现在默认使用 CUDA 12.8 构建，同时保持对 CUDA 12.1 及以上版本的支持。值得注意的是，最低 CuDNN 版本要求提升至 v9.8。

API 演进与现代化改进

JAX 团队持续推动 API 的现代化和一致性：

包管理规范调整：遵循 PEP 685 标准，包 extras 中的下划线改为连字符，例如 cuda12_local 变为 cuda12-local。
函数参数规范：jax.jit 现在要求函数参数必须按位置传递，额外参数必须使用关键字参数。这一变更将在 v0.7.X 中成为强制要求。
树操作简化：废弃了 jax.tree_util.build_tree，推荐使用更直观的 jax.tree.unflatten 替代。

废弃与移除的功能

本次版本清理了大量已废弃或内部使用的 API：

XLA 扩展接口：所有 jax.lib.xla_extension 中的 API 都被标记为废弃，开发者应逐步迁移到新接口。
MLIR 相关接口：意外导出的 jax.interpreters.mlir.hlo 和 jax.interpreters.mlir.func_dialect 已被移除，需要时可从 jax.extend.mlir 获取。
数据馈送接口：jax.lax.infeed 和 jax.lax.outfeed 系列接口被标记为废弃，将在 v0.7.0 中移除。
DLPack 接口调整：jax.dlpack.to_dlpack 被废弃，推荐直接使用数组的 __dlpack__ 属性。

性能与底层优化

主机回调改进：使用 XLA 的 FFI 重新实现了 CPU 和 GPU 设备的回调处理程序，取代了原有的自定义调用实现，提高了稳定性和性能。
内部工具清理：移除了多个内部使用的工具函数，如 jax.util 中的 HashableFunction、safe_map 等，简化了代码库。

开发者迁移建议

对于使用 JAX 进行开发的团队，建议采取以下措施：

检查废弃 API 使用：使用代码审计工具查找项目中使用了已废弃 API 的位置，特别是 infeed/outfeed 和数据序列化相关代码。
更新构建配置：确保 CI/CD 流水线中的 CUDA 和 CuDNN 版本满足新要求，并更新包安装命令中的 extras 名称。
规范参数传递：检查所有 jax.jit 调用点，确保函数参数按位置传递，配置参数按关键字传递。
测试回调逻辑：如果项目中使用主机回调，建议进行全面测试以确保新实现的回调处理程序与原有逻辑兼容。

JAX v0.6.0 的这些变更为未来的性能优化和功能扩展奠定了基础，虽然短期内可能需要一些迁移工作，但从长期来看将提高代码的稳定性和可维护性。

Composable transformations of Python+NumPy programs: differentiate, vectorize, JIT to GPU/TPU, and more

项目地址：https://gitcode.com/GitHub_Trending/ja/jax

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

昇腾LLM分布式训练框架

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started