PrIM (Processing-In-Memory) 基准测试套件使用教程
2024-09-14 02:22:48作者:霍妲思
1. 项目介绍
PrIM (Processing-In-Memory) 基准测试套件是由 CMU-SAFARI 开发的首个用于真实世界处理-内存 (PIM) 架构的基准测试套件。PrIM 旨在评估、分析和表征首个公开可用的真实世界 PIM 架构,即 UPMEM PIM 架构。UPMEM PIM 架构将传统的 DRAM 内存阵列与通用顺序核心(称为 DRAM 处理单元,DPUs)集成在同一芯片上。
PrIM 提供了一组常见的工作负载,用于评估 UPMEM PIM 架构,并可用于编程、架构和系统研究人员,以改进未来 PIM 硬件和软件的多个方面。工作负载具有不同的特征,表现出内存访问模式、操作和数据类型以及通信模式的异质性。
2. 项目快速启动
2.1 环境准备
在开始之前,确保你已经安装了 UPMEM SDK。PrIM 基准测试和微基准测试设计为在具有真实 UPMEM 模块的服务器上运行,但它们也可以在 UPMEM SDK 中包含的功能模拟器上运行。
2.2 克隆项目
首先,克隆 PrIM 基准测试套件的 GitHub 仓库:
git clone https://github.com/CMU-SAFARI/prim-benchmarks.git
cd prim-benchmarks
2.3 运行基准测试
PrIM 基准测试套件包含多个脚本,用于运行弱扩展和强扩展实验。以下是一些常用的脚本:
run_weak.py
: 用于运行 16 个 PrIM 基准测试的弱扩展实验,使用 1 个 UPMEM DPU 排名(1 到 64 个 DPU)。run_strong_rank.py
: 用于运行 16 个 PrIM 基准测试的强扩展实验,使用 1 个 UPMEM DPU 排名(1 到 64 个 DPU)。run_strong_full.py
: 用于运行 16 个 PrIM 基准测试的强扩展实验,使用 4 到 32 个 UPMEM DPU 排名(256 到 2048 个 DPU)。
例如,运行 BFS 基准测试的弱扩展实验:
python3 run_weak.py BFS
2.4 编译和运行单个基准测试
你也可以选择一个基准测试并编译运行。例如,编译并运行 BFS 基准测试:
cd BFS
NR_DPUS=32 NR_TASKLETS=16 make all
./bin/host_code -v 0 -f data/loc-gowalla_edges.txt
3. 应用案例和最佳实践
3.1 应用案例
PrIM 基准测试套件适用于多种应用场景,包括但不限于:
- 内存密集型计算:评估和优化内存密集型应用在 PIM 架构上的性能。
- 系统研究:用于系统研究人员评估和改进 PIM 硬件和软件。
- 编程模型研究:探索和优化 PIM 架构上的编程模型和算法。
3.2 最佳实践
- 数据准备:确保输入数据符合基准测试的要求,特别是对于需要特定数据格式的基准测试(如 BFS 和 SpMV)。
- 参数调优:根据硬件配置和应用需求,调整
NR_DPUS
和NR_TASKLETS
等参数,以获得最佳性能。 - 结果分析:使用生成的结果文件进行详细分析,以了解不同配置下的性能差异。
4. 典型生态项目
PrIM 基准测试套件与以下生态项目密切相关:
- UPMEM SDK:PrIM 基准测试套件依赖于 UPMEM SDK 来运行和模拟 PIM 架构。
- pbbsbench:用于生成基准测试所需的输入数据,特别是图数据(如 BFS 所需的 rMat 图)。
- UPMEM 社区:UPMEM 社区提供了丰富的资源和支持,包括文档、教程和论坛,帮助用户更好地使用 PrIM 基准测试套件。
通过结合这些生态项目,用户可以更全面地评估和优化 PIM 架构的性能。
热门项目推荐
相关项目推荐
鸿蒙开发工具大赶集
本仓将收集和展示鸿蒙开发工具,欢迎大家踊跃投稿。通过pr附上您的工具介绍和使用指南,并加上工具对应的链接,通过的工具将会成功上架到我们社区。012hertz
Go 微服务 HTTP 框架,具有高易用性、高性能、高扩展性等特点。Go01每日精选项目
🔥🔥 每日精选已经升级为:【行业动态】,快去首页看看吧,后续都在【首页 - 行业动态】内更新,多条更新哦~🔥🔥 每日推荐行业内最新、增长最快的项目,快速了解行业最新热门项目动态~~029kitex
Go 微服务 RPC 框架,具有高性能、强可扩展的特点。Go00Cangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。Cangjie057毕方Talon工具
本工具是一个端到端的工具,用于项目的生成IR并自动进行缺陷检测。Python040PDFMathTranslate
PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/DockerPython06mybatis-plus
mybatis 增强工具包,简化 CRUD 操作。 文档 http://baomidou.com 低代码组件库 http://aizuda.comJava03国产编程语言蓝皮书
《国产编程语言蓝皮书》-编委会工作区018- DDeepSeek-R1探索新一代推理模型,DeepSeek-R1系列以大规模强化学习为基础,实现自主推理,表现卓越,推理行为强大且独特。开源共享,助力研究社区深入探索LLM推理能力,推动行业发展。【此简介由AI生成】。Python00
热门内容推荐
最新内容推荐
项目优选
收起

Python - 100天从新手到大师
Python
609
115

本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
286
79

✍ WeChat Markdown Editor | 一款高度简洁的微信 Markdown 编辑器:支持 Markdown 语法、色盘取色、多图上传、一键下载文档、自定义 CSS 样式、一键重置等特性
Vue
111
25

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
60
48

🎉 基于Spring Boot、Spring Cloud & Alibaba、Vue3 & Vite、Element Plus的分布式前后端分离微服务架构权限管理系统
Vue
45
29

🦄🦄🦄AI赋能股票分析:自选股行情获取,成本盈亏展示,涨跌报警推送,市场整体/个股情绪分析,K线技术指标分析等。数据全部保留在本地。支持DeepSeek,OpenAI, Ollama,LMStudio,AnythingLLM,硅基流动,火山方舟,阿里云百炼等平台或模型。
Go
1
0

本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
205
57

前端智能化场景解决方案UI库,轻松构建你的AI应用,我们将持续完善更新,欢迎你的使用与建议。
官网地址:https://matechat.gitcode.com
184
34

🎉 基于SpringBoot,Spring Security,JWT,Vue & Element 的前后端分离权限管理系统,同时提供了 Vue3 的版本
Java
182
44

这是一个人工生命试验项目,最终目标是创建“有自我意识表现”的模拟生命体。
Java
8
0