Gunrock:GPU图分析的强大工具
2024-09-18 13:44:39作者:宣利权Counsellor
项目介绍
Gunrock 是一个专为GPU设计的CUDA库,专注于图处理。它采用了一种高层次、批量同步/异步、数据中心抽象的方法,特别关注顶点或边前沿的操作。Gunrock通过结合高性能GPU计算原语和优化策略(特别是在细粒度负载均衡方面),以及一种允许程序员快速开发新图原语的高层次编程模型,实现了性能和表达性之间的平衡。这使得开发者能够轻松地从单个GPU扩展到多个GPU,而无需深入了解GPU编程。
项目技术分析
Gunrock的核心技术在于其高效的GPU计算原语和优化策略。它利用CUDA的并行计算能力,通过高层次的编程模型简化了图算法的实现。Gunrock支持多种图算法,如广度优先搜索(BFS)、单源最短路径(SSSP)等,并且提供了丰富的示例和文档,帮助开发者快速上手。
Gunrock的架构设计灵活,支持从单个GPU到多个GPU的扩展,适用于不同的计算场景。其自动化的依赖管理(如NVIDIA/thrust
和NVIDIA/cub
)进一步简化了项目的构建和维护。
项目及技术应用场景
Gunrock适用于需要高性能图处理的多种场景,包括但不限于:
- 社交网络分析:快速分析大规模社交网络中的关系和影响力。
- 生物信息学:处理复杂的生物网络,如蛋白质相互作用网络。
- 推荐系统:通过图算法优化推荐系统的准确性和效率。
- 金融风控:分析交易网络中的异常行为和潜在风险。
项目特点
- 高性能:利用CUDA的并行计算能力,Gunrock在GPU上实现了高效的图处理。
- 易用性:高层次的编程模型和丰富的文档使得开发者能够快速上手,无需深入了解GPU编程。
- 灵活性:支持从单个GPU到多个GPU的扩展,适用于不同的计算需求。
- 自动化依赖管理:自动获取和配置外部依赖,简化了项目的构建和维护。
- 丰富的示例和文档:提供了多种图算法的示例和详细的文档,帮助开发者快速理解和使用Gunrock。
快速开始
在开始构建Gunrock之前,请确保您的系统上已安装CUDA Toolkit(推荐版本为v11.5.1或更高)。其他外部依赖(如NVIDIA/thrust
和NVIDIA/cub
)将通过cmake
自动获取。
git clone https://github.com/gunrock/gunrock.git
cd gunrock
mkdir build && cd build
cmake ..
make sssp # 或者使用 make -j$(nproc) 编译所有算法
bin/sssp ../datasets/chesapeake/chesapeake.mtx
实现图算法
Gunrock提供了详细的文档,帮助开发者理解和实现新的图算法。以下是一个简单的示例,展示了如何在GPU上使用Gunrock的数据中心、批量同步编程模型实现广度优先搜索(BFS)。
void prepare_frontier(frontier_t* f,
gcuda::multi_context_t& context) override {
auto P = this->get_problem();
f->push_back(P->param.single_source);
}
void loop(gcuda::multi_context_t& context) override {
auto E = this->get_enactor();
auto P = this->get_problem();
auto G = P->get_graph();
auto single_source = P->param.single_source;
auto distances = P->result.distances;
auto visited = P->visited.data().get();
auto iteration = this->iteration;
auto search = [=] __host__ __device__(
vertex_t const& source,
vertex_t const& neighbor,
edge_t const& edge,
weight_t const& weight) -> bool {
auto old_distance =
math::atomic::min(&distances[neighbor], iteration + 1);
return (iteration + 1 < old_distance);
};
operators::advance::execute<operators::load_balance_t::block_mapped>(
G, E, search, context);
}
引用Gunrock
感谢您对Gunrock的关注和支持。如果您在研究中使用了Gunrock,请引用以下文献:
@article{Wang:2017:GGG,
author = {Yangzihao Wang and Yuechao Pan and Andrew Davidson
and Yuduo Wu and Carl Yang and Leyuan Wang and
Muhammad Osama and Chenshan Yuan and Weitang Liu and
Andy T. Riffel and John D. Owens},
title = {{G}unrock: {GPU} Graph Analytics},
journal = {ACM Transactions on Parallel Computing},
year = 2017,
volume = 4,
number = 1,
month = aug,
pages = {3:1--3:49},
doi = {10.1145/3108140},
ee = {http://arxiv.org/abs/1701.01170},
acmauthorize = {https://dl.acm.org/doi/10.1145/3108140?cid=81100458295},
url = {http://escholarship.org/uc/item/9gj6r1dj},
code = {https://github.com/gunrock/gunrock},
ucdcite = {a115},
}
版权与许可
Gunrock由加利福尼亚大学董事会所有。该库、示例和所有源代码均在Apache 2.0许可下发布。
热门项目推荐
相关项目推荐
- 国产编程语言蓝皮书《国产编程语言蓝皮书》-编委会工作区017
- nuttxApache NuttX is a mature, real-time embedded operating system (RTOS).C00
- qwerty-learner为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件 / Words learning and English muscle memory training software designed for keyboard workersTSX027
- 每日精选项目🔥🔥 01.17日推荐:一个开源电子商务平台,模块化和 API 优先🔥🔥 每日推荐行业内最新、增长最快的项目,快速了解行业最新热门项目动态~~026
- Cangjie-Examples本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。Cangjie045
- 毕方Talon工具本工具是一个端到端的工具,用于项目的生成IR并自动进行缺陷检测。Python039
- PDFMathTranslatePDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/DockerPython05
- mybatis-plusmybatis 增强工具包,简化 CRUD 操作。 文档 http://baomidou.com 低代码组件库 http://aizuda.comJava03
- advanced-javaAdvanced-Java是一个Java进阶教程,适合用于学习Java高级特性和编程技巧。特点:内容深入、实例丰富、适合进阶学习。JavaScript0108
- taro开放式跨端跨框架解决方案,支持使用 React/Vue/Nerv 等框架来开发微信/京东/百度/支付宝/字节跳动/ QQ 小程序/H5/React Native 等应用。 https://taro.zone/TypeScript09
热门内容推荐
最新内容推荐
项目优选
收起
Python-100-Days
Python - 100天从新手到大师
Python
263
53
国产编程语言蓝皮书
《国产编程语言蓝皮书》-编委会工作区
64
16
open-eBackup
open-eBackup是一款开源备份软件,采用集群高扩展架构,通过应用备份通用框架、并行备份等技术,为主流数据库、虚拟化、文件系统、大数据等应用提供E2E的数据备份、恢复等能力,帮助用户实现关键数据高效保护。
HTML
85
63
openHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
53
44
Cangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
195
45
HarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
268
69
xxl-job
XXL-JOB是一个分布式任务调度平台,其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司线上产品线,开箱即用。
Java
9
0
RuoYi-Vue
🎉 基于SpringBoot,Spring Security,JWT,Vue & Element 的前后端分离权限管理系统,同时提供了 Vue3 的版本
Java
171
41
RuoYi-Cloud-Vue3
🎉 基于Spring Boot、Spring Cloud & Alibaba、Vue3 & Vite、Element Plus的分布式前后端分离微服务架构权限管理系统
Vue
38
24
qwerty-learner
为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件 / Words learning and English muscle memory training software designed for keyboard workers
TSX
332
27