【亲测免费】 NVIDIA's GDRCopy 开源项目下载与安装教程

2026-01-25 06:10:55作者：卓炯娓

1. 项目介绍

GDRCopy 是一个基于 NVIDIA GPUDirect RDMA 技术设计的快速GPU内存复制库，专为追求低延迟需求而生。通过利用GPUDirect RDMA的功能，该库能够创建用户空间上的GPU内存映射，让这些映射后的内存仿佛普通主机内存一样被操作（虽然存在一些注意事项）。GDRCopy的特点是极低的开销，因为它是CPU驱动的，通常情况下，cudaMemcpy可能产生约6-7微秒的开销。此外，它支持高速H到D（Host到Device）数据传输，速率可达6-8GB/s（依赖于Ivy Bridge Xeon处理器，并受NUMA效应影响），但D到H（Device到Host）相对较慢，由于GPU BAR无法预读，导致不能生成突发读取事务。

2. 项目下载位置

项目托管在GitHub上，你可以直接访问以下链接进行下载：

[GitHub - NVIDIA/gdrcopy](https://github.com/NVIDIA/gdrcopy.git)

要克隆此项目到本地，可以使用Git命令行工具执行：

git clone https://github.com/NVIDIA/gdrcopy.git

3. 项目安装环境配置

环境要求:

硬件: 需要NVIDIA数据中心GPU或RTX GPU（基于Kepler或更新架构）。
操作系统: 支持Linux x86_64, ppc64le, arm64架构，推荐RHEL8、RHEL9、Ubuntu20.04、Ubuntu22.04、SLE-15等。
软件: 必须有CUDA >= 6.0，GPU驱动 >= 418.40（ppc64le）或 >= 331.14（其他平台），DKMS用于动态内核模块，以及必要的编译工具链。

示例图片配置:

由于Markdown文本格式限制，无法直接插入图片，但实际操作中，你应该配置好如下的开发环境：

安装dkms, build-essential, cuda等包的屏幕截图；
确认CUDA版本和GPU驱动正确安装的终端输出示例；

手动步骤包括：

安装必要软件包 (sudo apt-get install cuda dkms build-essential ...) 或在RHEL/SLES使用相应的包管理器安装。
确保CUDA和驱动已安装 (nvidia-smi 命令输出验证)。

4. 项目安装方式

从源代码安装

获取源码: 已在步骤2中完成。
环境设置: 根据系统类型，配置CUDA路径并准备编译环境。
编译与安装: 执行以下命令以编译和安装GDRCopy（替换<install-to-this-location>和<cuda-install-top-dir>为实际路径）：
```
make prefix=<install-to-this-location> CUDA=<cuda-install-top-dir> all install
```
加载模块: 使用提供的脚本加载内核模块:
```
sudo ./insmod.sh
```