【免费下载】 bitsandbytes项目安装指南：从CUDA到多后端支持详解

2026-02-04 04:14:44作者：范靓好Udolf

bitsandbytes是一个专注于高效深度学习计算的Python库，特别针对大模型训练和推理场景进行了优化。本文将全面介绍如何在不同硬件平台上安装和使用bitsandbytes，包括NVIDIA CUDA、AMD ROCm和Intel XPU等多种计算后端。

硬件要求与兼容性

bitsandbytes的核心功能对硬件有特定要求，主要分为以下几类：

NVIDIA GPU支持：
- LLM.int8()功能：需要计算能力7.5+的GPU（如RTX 20系列、T4及以上）
- 8-bit优化器/量化：需要计算能力5.0+的GPU（如GTX 900系列及以上）
- NF4/FP4量化：同样需要计算能力5.0+的GPU
AMD GPU支持（预览版）：
- 需要CDNA架构（gfx90a）或RDNA架构（gfx1100）的GPU
- ROCm 6.1+版本支持
Intel平台支持（预览版）：
- CPU：支持主流Intel处理器
- GPU：支持Intel独立显卡
- 需要Intel Extension for PyTorch支持

标准安装方法

CUDA平台安装（推荐）

对于大多数NVIDIA GPU用户，最简单的安装方式是使用pip：

pip install bitsandbytes

系统会自动安装与您的CUDA版本兼容的预编译二进制包。当前支持的CUDA版本范围从11.8到12.8，覆盖了从Maxwell到最新Ada Lovelace架构的GPU。

多后端预览版安装

如果您需要使用AMD或Intel硬件，可以安装多后端预览版：

# Linux系统
pip install --force-reinstall 'bitsandbytes-0.44.1.dev0-py3-none-manylinux_2_24_x86_64.whl'

# Windows系统
pip install --force-reinstall 'bitsandbytes-0.44.1.dev0-py3-none-win_amd64.whl'

从源码编译安装

在某些特殊情况下（如使用非标准CUDA版本或特定硬件配置），您可能需要从源码编译安装。

Linux系统编译

安装编译依赖：

apt-get install -y build-essential cmake

克隆仓库并编译：

git clone https://github.com/bitsandbytes-foundation/bitsandbytes.git
cd bitsandbytes/
cmake -DCOMPUTE_BACKEND=cuda -S .
make
pip install -e .

Windows系统编译

确保已安装Visual Studio和CUDA Toolkit
执行编译命令：

git clone https://github.com/bitsandbytes-foundation/bitsandbytes.git
cd bitsandbytes/
cmake -DCOMPUTE_BACKEND=cuda -S .
cmake --build . --config Release
pip install -e .

特定硬件平台支持

AMD ROCm平台

准备ROCm环境（推荐使用Docker）：

docker pull rocm/dev-ubuntu-22.04:6.3.4-complete
docker run -it --device=/dev/kfd --device=/dev/dri --group-add video rocm/dev-ubuntu-22.04:6.3.4-complete

安装兼容的PyTorch：

pip install torch --index-url https://download.pytorch.org/whl/rocm6.3/

编译bitsandbytes：

cmake -DCOMPUTE_BACKEND=hip -S .
make
pip install -e .

Intel平台

对于Intel CPU/GPU用户：

安装Intel扩展：

pip install intel_extension_for_pytorch

编译安装：

cmake -DCOMPUTE_BACKEND=cpu -S .
make
pip install .

常见问题与建议

版本兼容性：建议使用Python 3.9+版本，并确保CUDA驱动版本与bitsandbytes要求的CUDA Toolkit版本兼容。
性能优化：对于NVIDIA GPU，Turing架构（RTX 20系列）及以上能获得最佳性能；AMD GPU建议使用CDNA架构的专业卡。
预览版注意事项：多后端支持目前仍处于技术预览阶段，不建议在生产环境中使用。
编译问题：如果遇到编译错误，请检查CMake版本（需要≥3.22.1）和编译器版本（GCC≥9或MSVC 19.43+）。

通过本文的指导，您应该能够在各种硬件平台上成功安装和使用bitsandbytes库，充分利用其高效的量化计算能力来加速您的深度学习工作负载。

bitsandbytes

8-bit CUDA functions for PyTorch

项目地址：https://gitcode.com/gh_mirrors/bi/bitsandbytes

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

【免费下载】 bitsandbytes项目安装指南：从CUDA到多后端支持详解

硬件要求与兼容性

标准安装方法

CUDA平台安装（推荐）

多后端预览版安装

从源码编译安装

Linux系统编译

Windows系统编译

特定硬件平台支持

AMD ROCm平台

Intel平台

常见问题与建议

热门内容推荐

最新内容推荐

项目优选

【免费下载】 bitsandbytes项目安装指南：从CUDA到多后端支持详解

硬件要求与兼容性

标准安装方法

CUDA平台安装（推荐）

多后端预览版安装

从源码编译安装

Linux系统编译

Windows系统编译

特定硬件平台支持

AMD ROCm平台

Intel平台

常见问题与建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选