Slang编译器CUDA代码生成问题分析与修复

2025-06-17 07:05:11作者：苗圣禹Peter

问题背景

在Slang编译器项目中，开发团队发现当使用新的编译API时，生成的CUDA中间代码存在语法错误。具体表现为在处理计算着色器的线程ID访问时，生成了无效的指针解引用操作。

当编译一个简单的计算着色器时，新API生成的CUDA代码包含如下错误语句：

uint _S2 = (&_S1).x;

这段代码尝试对uint3类型的指针直接进行成员访问，这在CUDA/NVRTC中是不合法的语法。正确的做法应该是先解引用指针，再进行成员访问。

通过深入调查，团队发现问题的根源在于新旧API对入口函数参数的处理方式不同：

Func(Void, ConstRef(Vec(UInt, 3 : Int)))

参数被标记为常量引用(ConstRef)，这使得后续优化能够正确处理参数访问。

Func(Void, Vec(UInt, 3 : Int))

参数没有被标记为引用，导致在后续处理中产生了错误的指针操作。

进一步追踪发现，这种差异源于编译器前端对入口函数属性的处理不一致。旧API会自动为入口函数添加EntryPointAttribute装饰，而新API在某些情况下（如缺少显式着色器属性时）会遗漏这一关键信息。

团队采取了以下修复措施：

这一修复不仅解决了直接的代码生成问题，还带来了以下技术收益：

这个案例展示了编译器开发中的几个重要经验：

通过这次问题修复，Slang编译器在CUDA代码生成方面的稳定性和可靠性得到了进一步提升。

登录后查看全文