AdaptiveCpp 25.02发布：跨架构计算的重大升级

2025-06-29 11:25:41作者：薛曦旖Francesca

Compiler for multiple programming models (SYCL, C++ standard parallelism, HIP/CUDA) for CPUs and GPUs from all vendors: The independent, community-driven compiler for C++-based heterogeneous programming models. Lets applications adapt themselves to all the hardware in the system - even at runtime!

项目地址：https://gitcode.com/gh_mirrors/ad/AdaptiveCpp

项目简介

AdaptiveCpp（原名为hipSYCL）是一个创新的异构计算框架，它通过扩展标准C++实现了跨平台、跨架构的并行计算能力。该项目最显著的特点是能够将同一份代码编译后运行在CPU、NVIDIA GPU、AMD GPU和Intel GPU等多种硬件架构上，大大简化了异构计算的开发流程。

核心更新：PCUDA编程模型

AdaptiveCpp 25.02版本最引人注目的特性是引入了全新的PCUDA（Portable CUDA）编程模型。这一创新使得开发者能够：

直接重用现有CUDA/HIP代码：开发者不再需要将CUDA或HIP代码完全重写为SYCL，可以直接使用原有代码库。
真正的跨架构支持：PCUDA编译后的单一二进制文件可以自动适配多种硬件架构，包括CPU、NVIDIA GPU、AMD GPU和Intel GPU。
与其他模型无缝集成：PCUDA可以与SYCL和C++标准并行计算模型混合使用，为开发者提供极大的灵活性。
性能优化：测试数据显示，在某些情况下，PCUDA的性能甚至超过了原生CUDA/HIP编译器。

技术实现亮点

PCUDA并非简单的SYCL封装层，而是AdaptiveCpp编译器对CUDA/HIP编程模型的原生支持。这种设计带来了几个关键优势：

低开销：由于是原生实现，避免了额外的抽象层带来的性能损耗。
编译效率：相比SYCL，PCUDA采用更接近C语言的实现方式，显著减少了编译时间。
内核提交延迟：当前版本的PCUDA比SYCL具有更低的内核提交延迟。

跨平台支持增强

25.02版本在跨平台支持方面也有重大改进：

LLVM集成：现在可以将AdaptiveCpp直接构建到LLVM工具链中，这带来了更稳定的Windows和macOS支持。
Windows二进制分发：项目现在提供预编译的Windows版本，大大降低了入门门槛。
macOS支持：通过LLVM集成方式，macOS平台现在可以完整使用通用JIT编译器功能。

性能表现

从官方提供的基准测试数据来看：

在NVIDIA RTX A5000上，AdaptiveCpp的PCUDA模式性能与原生CUDA相当，某些情况下甚至略优。
在AMD Radeon Pro VII上，PCUDA模式性能接近原生HIP实现。
在Intel UHD630上，通过OpenCL后端，AdaptiveCpp展示了良好的跨架构兼容性。

其他重要改进

NUMA节点支持：新增扩展允许在CPU设备上分配USM内存时指定NUMA节点。
LLVM版本支持：新增对LLVM 19和20的支持。
稳定性提升：包含大量错误修复和性能优化。

应用场景建议

PCUDA特别适合以下场景：

已有CUDA/HIP代码库需要跨平台运行
需要逐步迁移现有CUDA/HIP代码
对编译时间敏感的项目
需要更低内核提交延迟的应用
偏好C风格API而非C++抽象的开发团队

总结

AdaptiveCpp 25.02通过引入PCUDA编程模型，为异构计算领域带来了新的可能性。它不仅在保持性能的同时简化了跨平台开发，还通过LLVM集成增强了各平台的支持。对于需要在多种硬件架构上部署高性能计算应用的开发者来说，这无疑是一个值得关注的重要更新。

Compiler for multiple programming models (SYCL, C++ standard parallelism, HIP/CUDA) for CPUs and GPUs from all vendors: The independent, community-driven compiler for C++-based heterogeneous programming models. Lets applications adapt themselves to all the hardware in the system - even at runtime!

项目地址：https://gitcode.com/gh_mirrors/ad/AdaptiveCpp

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。