首页
/ Coriander:让CUDA代码在OpenCL设备上飞驰

Coriander:让CUDA代码在OpenCL设备上飞驰

2024-09-20 01:41:56作者:贡沫苏Truman

项目介绍

Coriander 是一个开源项目,旨在将 NVIDIA® CUDA™ 代码编译为 OpenCL™ 1.2 设备可执行的代码。这意味着开发者可以将现有的 CUDA 应用程序无缝迁移到支持 OpenCL 1.2 的 GPU 上运行,而无需对源代码进行大量修改。Coriander 不仅支持编译 CUDA 代码,还提供了对 cuBLAS 和 cuDNN API 的部分实现,使得高性能计算和深度学习任务在 OpenCL 平台上也能高效运行。

项目技术分析

Coriander 的核心技术在于其独特的编译流程。它通过两步编译过程将 CUDA 代码转换为 OpenCL 1.2 代码:

  1. 主机端代码编译:处理内存分配、数据拷贝、流操作和内核启动等任务。
  2. 设备端代码编译:将模板化的 C++ 代码转换为标准的 OpenCL 1.2 代码。

此外,Coriander 还集成了 Cedric Nugteren 的 CLBlast 库,用于实现 cuBLAS 和 cuDNN API 的部分功能,如 GEMM、GEMV、SCAL、SAXPY 等。

项目及技术应用场景

Coriander 的应用场景非常广泛,尤其适合以下几种情况:

  • 跨平台开发:开发者可以在不同的硬件平台上运行相同的 CUDA 代码,无需为每个平台单独编写代码。
  • 高性能计算:Coriander 支持 cuBLAS 和 cuDNN API,使得在 OpenCL 平台上进行高性能计算和深度学习任务成为可能。
  • 资源受限环境:在某些环境中,可能无法使用 NVIDIA 的 GPU,但可以通过 Coriander 将 CUDA 代码迁移到其他支持 OpenCL 的设备上运行。

项目特点

  • 跨平台兼容性:Coriander 支持将 CUDA 代码编译为 OpenCL 1.2 代码,使得应用程序可以在任何支持 OpenCL 1.2 的 GPU 上运行。
  • 高性能计算支持:通过集成 CLBlast 库,Coriander 提供了对 cuBLAS 和 cuDNN API 的部分实现,支持高性能计算和深度学习任务。
  • 易于使用:Coriander 提供了简单的编译命令 cocl_py,开发者只需几步即可将 CUDA 代码编译为 OpenCL 代码并运行。
  • 插件扩展:Coriander 支持插件机制,开发者可以轻松安装和使用如 coriander-clblastcoriander-dnn 等插件,扩展项目功能。

结语

Coriander 为开发者提供了一个强大的工具,使得 CUDA 代码能够在更广泛的硬件平台上运行。无论你是高性能计算的爱好者,还是深度学习的研究者,Coriander 都能为你提供跨平台的解决方案。赶快尝试一下,让你的 CUDA 代码在 OpenCL 设备上飞驰吧!


项目地址: Coriander GitHub

许可证: Apache 2.0

登录后查看全文
热门项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
23
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
225
2.27 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
flutter_flutterflutter_flutter
暂无简介
Dart
526
116
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
988
585
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
351
1.42 K
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
61
17
GLM-4.6GLM-4.6
GLM-4.6在GLM-4.5基础上全面升级:200K超长上下文窗口支持复杂任务,代码性能大幅提升,前端页面生成更优。推理能力增强且支持工具调用,智能体表现更出色,写作风格更贴合人类偏好。八项公开基准测试显示其全面超越GLM-4.5,比肩DeepSeek-V3.1-Terminus等国内外领先模型。【此简介由AI生成】
Jinja
47
0
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
17
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
JavaScript
212
288