OpenPI项目在RTX5090环境下的JAX编译问题解决方案

2025-06-26 04:21:57作者：范垣楠Rhoda

可用于机器人任务的视觉语言动作（VLA）模型开发与应用，提供π₀、π₀-FAST、π₀.₅等预训练模型，支持开箱即用或自定义数据集微调，适用于多种机器人平台的操作任务。

项目地址：https://gitcode.com/GitHub_Trending/op/openpi

问题背景

在使用OpenPI项目进行AI推理时，部分用户在RTX5090显卡环境下遇到了XlaRuntimeError错误，提示"ptxas too old. Falling back to the driver to compile"。这个问题主要出现在创建训练策略(policy)时，当系统尝试编译CUDA代码时，发现ptxas工具版本过旧，无法支持RTX5090显卡的CC 12.0架构。

错误分析

该错误的核心在于CUDA工具链与新显卡架构的兼容性问题。RTX5090采用了最新的计算能力(CC)12.0架构，而系统中安装的ptxas工具版本可能较旧，无法识别和编译针对该架构的代码。JAX/XLA在检测到这一情况后会尝试回退到使用CUDA驱动进行编译，但某些情况下这种回退机制可能无法正常工作。

解决方案

经过实践验证，可以通过以下步骤解决该问题：

升级PyTorch相关包到nightly版本：PyTorch的nightly版本通常包含了对最新硬件架构的支持和修复。
更新JAX及相关包到最新版本：JAX的最新版本改进了对新型GPU架构的支持，并优化了编译流程。
确保CUDA工具链完整且版本匹配：检查CUDA工具包版本是否与显卡驱动和深度学习框架要求相匹配。

实施建议

对于遇到类似问题的用户，建议按照以下顺序操作：

首先确认显卡驱动版本是否支持RTX5090
检查已安装的CUDA工具包版本
更新PyTorch到最新nightly版本
升级JAX及其依赖到最新稳定版
验证环境变量设置是否正确指向新版CUDA工具链

技术原理

该问题的本质是深度学习框架的JIT编译系统与硬件架构的匹配问题。JAX使用XLA作为后端编译器，当检测到本地ptxas工具无法处理特定架构时，会尝试其他编译路径。升级相关软件包可以确保框架内置对新架构的支持，避免依赖系统工具链的版本限制。

总结

在部署OpenPI等先进AI项目时，保持软件栈的更新是确保兼容性的关键。特别是当使用最新硬件时，更需要关注框架与硬件的匹配程度。通过系统性地升级相关组件，可以有效解决此类编译错误，使项目能够充分利用新硬件的计算能力。

可用于机器人任务的视觉语言动作（VLA）模型开发与应用，提供π₀、π₀-FAST、π₀.₅等预训练模型，支持开箱即用或自定义数据集微调，适用于多种机器人平台的操作任务。

项目地址：https://gitcode.com/GitHub_Trending/op/openpi

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Oohos_react_native

React Native鸿蒙化仓库