PrIM (Processing-In-Memory) 基准测试套件使用教程

2024-09-14 01:29:33作者：霍妲思

1. 项目介绍

PrIM (Processing-In-Memory) 基准测试套件是由 CMU-SAFARI 开发的首个用于真实世界处理-内存 (PIM) 架构的基准测试套件。PrIM 旨在评估、分析和表征首个公开可用的真实世界 PIM 架构，即 UPMEM PIM 架构。UPMEM PIM 架构将传统的 DRAM 内存阵列与通用顺序核心（称为 DRAM 处理单元，DPUs）集成在同一芯片上。

PrIM 提供了一组常见的工作负载，用于评估 UPMEM PIM 架构，并可用于编程、架构和系统研究人员，以改进未来 PIM 硬件和软件的多个方面。工作负载具有不同的特征，表现出内存访问模式、操作和数据类型以及通信模式的异质性。

2. 项目快速启动

2.1 环境准备

在开始之前，确保你已经安装了 UPMEM SDK。PrIM 基准测试和微基准测试设计为在具有真实 UPMEM 模块的服务器上运行，但它们也可以在 UPMEM SDK 中包含的功能模拟器上运行。

2.2 克隆项目

首先，克隆 PrIM 基准测试套件的 GitHub 仓库：

git clone https://github.com/CMU-SAFARI/prim-benchmarks.git
cd prim-benchmarks

2.3 运行基准测试

PrIM 基准测试套件包含多个脚本，用于运行弱扩展和强扩展实验。以下是一些常用的脚本：

run_weak.py: 用于运行 16 个 PrIM 基准测试的弱扩展实验，使用 1 个 UPMEM DPU 排名（1 到 64 个 DPU）。
run_strong_rank.py: 用于运行 16 个 PrIM 基准测试的强扩展实验，使用 1 个 UPMEM DPU 排名（1 到 64 个 DPU）。
run_strong_full.py: 用于运行 16 个 PrIM 基准测试的强扩展实验，使用 4 到 32 个 UPMEM DPU 排名（256 到 2048 个 DPU）。

例如，运行 BFS 基准测试的弱扩展实验：

python3 run_weak.py BFS

2.4 编译和运行单个基准测试

你也可以选择一个基准测试并编译运行。例如，编译并运行 BFS 基准测试：

cd BFS
NR_DPUS=32 NR_TASKLETS=16 make all
./bin/host_code -v 0 -f data/loc-gowalla_edges.txt

3. 应用案例和最佳实践

3.1 应用案例

PrIM 基准测试套件适用于多种应用场景，包括但不限于：

内存密集型计算：评估和优化内存密集型应用在 PIM 架构上的性能。
系统研究：用于系统研究人员评估和改进 PIM 硬件和软件。
编程模型研究：探索和优化 PIM 架构上的编程模型和算法。

3.2 最佳实践

数据准备：确保输入数据符合基准测试的要求，特别是对于需要特定数据格式的基准测试（如 BFS 和 SpMV）。
参数调优：根据硬件配置和应用需求，调整 NR_DPUS 和 NR_TASKLETS 等参数，以获得最佳性能。
结果分析：使用生成的结果文件进行详细分析，以了解不同配置下的性能差异。

4. 典型生态项目

PrIM 基准测试套件与以下生态项目密切相关：

UPMEM SDK：PrIM 基准测试套件依赖于 UPMEM SDK 来运行和模拟 PIM 架构。
pbbsbench：用于生成基准测试所需的输入数据，特别是图数据（如 BFS 所需的 rMat 图）。
UPMEM 社区：UPMEM 社区提供了丰富的资源和支持，包括文档、教程和论坛，帮助用户更好地使用 PrIM 基准测试套件。

通过结合这些生态项目，用户可以更全面地评估和优化 PIM 架构的性能。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.35 K

758