xFormers项目对CUDA 12.4和PyTorch 2.4的兼容性进展

2025-05-25 16:44:40作者：宣聪麟

Hackable and optimized Transformers building blocks, supporting a composable construction.

项目地址：https://gitcode.com/gh_mirrors/xf/xformers

在深度学习领域，xFormers作为一个高效的Transformer模型加速库，其与CUDA和PyTorch版本的兼容性一直是开发者关注的焦点。近期，随着CUDA 12.4和PyTorch 2.4的发布，社区对xFormers兼容新版本的需求日益增长。

背景与需求

xFormers项目团队原本主要维护CUDA 11.8和12.1两个版本的预编译二进制文件。然而，随着PyTorch 2.4的推出以及CUDA 12.4的普及，许多基于xFormers的项目（如Stable Diffusion WebUI Forge）开始迁移到新版本环境。这种迁移带来了兼容性问题，特别是当用户尝试在CUDA 12.4和PyTorch 2.4环境下使用xFormers时，常常会遇到"TypeError: 'NoneType' object is not iterable"等错误。

技术挑战与解决方案

xFormers团队面临的主要挑战是维护多个CUDA版本预编译二进制文件的成本问题。每个新版本的CUDA都需要额外的构建和测试资源。然而，考虑到PyTorch官方计划逐步淘汰对CUDA 11.8的支持，xFormers团队也相应地调整了支持策略。

最新进展显示，xFormers已经提供了对CUDA 12.4的预编译支持，包括针对Python 3.8至3.12的各种版本。这些预编译文件可以通过常规的pip安装命令获取，无需用户自行从源码编译。

安装指南

对于需要使用CUDA 12.4和PyTorch 2.4环境的开发者，现在可以通过以下方式获取兼容的xFormers版本：

确保已安装正确版本的PyTorch（2.4或更高）
使用pip安装最新版的xFormers

值得注意的是，开发者应避免固定特定的开发版本号（如0.0.28.dev895），而应该安装官方发布的最新稳定版本。xFormers与PyTorch版本之间存在明确的对应关系，具体可以参考项目的更新日志。

未来展望

随着PyTorch对CUDA 11.8支持的逐步淘汰，xFormers团队表示将同步跟进，届时会提供对新版CUDA更全面的支持。对于开发者而言，这意味着未来在xFormers与新版本CUDA和PyTorch的兼容性方面将获得更好的体验。

对于目前仍在使用旧版环境的项目，xFormers团队建议暂时保持现有环境，或者选择官方推荐的CUDA 12.1+PyTorch 2.3.1组合，以确保最佳兼容性和性能表现。

总的来说，xFormers项目团队积极响应社区需求，不断优化对新版本CUDA和PyTorch的支持，为深度学习开发者提供了更灵活、更高效的工具选择。

Hackable and optimized Transformers building blocks, supporting a composable construction.

项目地址：https://gitcode.com/gh_mirrors/xf/xformers

登录后查看全文

最新内容推荐

Python开发者的macOS终极指南：VSCode安装配置全攻略基于Matlab的等几何分析IGA软件包：工程计算与几何建模的完美融合深入解析Windows内核模式驱动管理器：系统驱动管理的终极利器基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器咖啡豆识别数据集：AI目标检测在咖啡质量控制中的革命性应用 STM32到GD32项目移植完全指南：从兼容性到实战技巧瀚高迁移工具migration-4.1.4：企业级数据库迁移的智能解决方案昆仑通态MCGS与台达VFD-M变频器通讯程序详解：工业自动化控制完美解决方案 PADS元器件位号居中脚本：提升PCB设计效率的自动化利器 MQTT客户端软件源代码：物联网开发的强大工具与最佳实践指南

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

cangjie_runtime

仓颉编程语言运行时与标准库。